「習甦」 特徴:多層構造を持つ評価関数 ・駒の価値:盤面全体の駒の利きと持駒および手番から算出する玉の安全度に対応した非線形関数 ・駒の働き:入玉していない玉と玉以外の2つの駒の位置関係 →入玉して玉の安全度が高くなると、持駒と敵陣にいる駒が小駒:大駒=1:5の駒割に近づく。 評価パラメータの機械学習方法 ・前世代の評価関数を用いてフィッシャーランダムチェスに準じたユニークな初期局面2494800からの自己対戦棋譜を数セット作成する。 ・自己対戦棋譜における評価値の推移をフィードバックして推定された勝率を割引報酬として強化学習する。