チームビール工房HFT支店@wcsc31アピール文 Have Fun Tech代表の曽根壮大と第28回優勝,第29回準優勝の芝世弐のチームです。 2020年,コンピュータ将棋の新棋戦「電竜戦」が開催されました。 サーバのテストなど多くの準備をする際にテストプログラムの多様性を目的に機械学習データ流用で新規に独自性のあるものを作ろうとしたプロジェクトが立ち上がりました。二番絞りプロジェクトです。 電竜戦の準備の度に強化され,本戦では上位に劣る計算機にて予選3位となりました。 その過程は第45回ゲーム情報学研究会で報告してあり,またblogにも簡単にまとめてあります。 https://bleu48.hatenablog.com/entry/2021/03/09/075032 本チームはこの後継プログラムを選手権に投入するために結成されました。 面白そうに言うと二番シードを捨てて二番絞りのエントリーです。 ただ,目標は優勝です。 二番絞りプロジェクトにおいて電竜戦では流用元をAobaZeroとし,同サイズの20ブロックのモデルを作成しました。 その後,データ流用でそれより強化された15ブロックのモデルが完成されたためそれにより教師データを数億作成し そのデータを40ブロックのモデルの学習に転用したものが現時点で最強となっています。 恐らく将棋の深層学習モデルとして過去最強であることは疑いがないところです。 この40ブロックのResNetモデルですが,二世代前のGPU1枚でfloodgateレートで3800近くをたたき出しています。 単純に例えれば,最後のハードウェア統一戦である第5回電王トーナメントにエントリーしていれば優勝するレベルであろうと思われます。 今のGPUでは探索速度が文字通り桁違いですのでどこまで伸びるかギリギリまで強化学習を進めようと考えています。 また,モデルに関してはブロック数,チャンネル数のみならずポリシーヘッド,バリューヘッドの部分変更など複数パターンをテスト中ですので本戦で用いるのが40ブロックになるかどうかは乞うご期待と言った感じです。 ちょっと囲碁に浮気していたとの噂があります。 http://entcog.c.ooco.jp/entcog/new_uec/ 囲碁と将棋で技術転用が可能であるようです。