dainomaruDNNcは昨年出場したライブラリーと異なり、dlshogiを使用した。 dlshogiではディープラーニングによる強化学習を行っているものとなっている。 elmo_for_leamにて訓練データ(17.6GB)、テストデータ(2057件)により 強化学習を行った。MomentumSGDをRMSpropGravesに変更、ミニバッチ256、エポック2にて実施した。 batchsize=256、 RMSpropGraves(lr=0.001) WeightDecay(rate=0) val_lambda=0.5 train position num = 500000000 test position num = 6234 dlshogiのライブラリからの変更点は強化学習における最適化手法をMomentumSGDからRMSpropGravesに変更 した1点のみである。