2019年アピール文書 プログラムの基本は初回参加時から使いまわしていて 一般的な手法であるαβ法、ハッシュテーブル、null move等を使っています。 今回は、去年からの学習方法から一部変更して教師無し学習の3駒間の評価値を学習させています。 学習方法は強化学習(Q-Learn)のみです。 ********************************************************************************** 2018年アピール文書 プログラムの基本は初回参加時から使いまわしているものを使っています。 今回も、教師無し学習にて3駒間+2駒間の評価値を学習させています。 学習は強化学習と遺伝的学習を組み合わせています。 前回に比較して大きな変更はありません。バグ修正レベルの変更です。 ********************************************************************************** 2017年アピール文書 プログラムの基本は初回参加時から使いまわしているものを使い、 今回(前回も)は、教師無し学習を試してみたくなったので 強化学習と遺伝的学習を組み合わせて作成している。 去年は、時間の都合で学習がほとんど進まなかったので 既存の評価値データでの参加だったが、 今回は学習に時間が取れそうなので学習した評価値での参加を考えている。 序盤については、以前から持っているの序盤データをそのまま使用する予定。 たとえ、以前のものよりも弱くなっていたとしても、 学習したデータで望むつもりである。