アピール文 プログラム名:いちびん プログラムの紹介: 一言で言えば; 「将棋指手の評価反省に基づく教師データの調整」 ダラダラ言えば; 評価関数の学習を行う際に使用する教師データをもとに、明らかに評価が甘い指手や悪手と思えわれる指手の前後数手を選び出すアルゴリズムを自作した。そして、選び出した複数の指し手を、より深い探索で再評価して元の評価データと入れ替えた。この手法により、より精度の高い教師データを得て学習効率の向上を目指した。 具体的には、深さ14で自作した約2億7千万の教師データ局面を検査対象として、アルゴリズムで引っかかった局面を、深さ20〜24程度まで探索する。再評価した評価点をもとの教師データに反映する。途方もない時間がかかるが、アルゴリズムで引っかかった局面を確度によってグループ分けすることで、概査から精査へと徐々に絞り込みを行うことが可能となり、コンピュータが自動で全部行ってくれるので、私は、寝て待つだけである。 2020年の11月に行なわれた第1回電竜戦で、NPS550万程度のパワーで、A級7位となり、それなりの手ごたえを得た。今回は、その延長線上で頑張ってみます。 記:2021年2月6日