「習甦」 ・探索:1スレッドはdf-pnにより詰みを確認,他のスレッドはStockfishから取捨選択したシンプルなα-β探索 ・評価関数:玉の位置に対する各駒の位置と全升目の利き数(先後別3まで)を特徴量とするニューラルネットワーク ・学習:自己対戦棋譜におけるサンプリングした局面から終局までの評価値(勝率)を割引累積報酬として強化学習