Google DeepMind社が公開したOpenSpielって何?
- OpenSpielとは?
OpenSpiel is a collection of environments and algorithms for research in general reinforcement learning and search/planning in games.
OpenSpiel公式GitHubより引用
ゲームの強化学習に利用可能なアルゴリズムをまとめて公開したよ、といったところでしょうか。
- どんなゲームのアルゴリズムがあるの?
このプロジェクトを公開したのは、AlphaGo / AlphaZeroで世界中に大きな衝撃を与えたデミス・ハサビス氏がCEOを務めるGoogle DeepMind社です。
囲碁、チェス、バックギャモン、ポーカーなど、主にボードゲームのアルゴリズムが数十種類含まれています。
- これ使えばAlpha(Go)Zero作れるじゃん!
残念ながら、現時点(2019/09/13現在)で強化学習用プログラムは公開されておらず、アルゴリズムのみとなっています。
※「強化学習用プログラムは無いから誰か作ってプルリクエスト送ってね」と公式GitHubに明記されてる。
僕もそう思ってウッキウキでOpenSpiel環境を構築したのは秘密
- アルゴリズムだけでどうすりゃいいってんだ!
DeepMindのアルゴリズムはとてもシンプルで分かりやすいです。
ソースコードを読んでアルゴリズムの勉強をするもよし。
手元に強化学習プログラムがあるなら、そこにOpenSpielのアルゴリズムを取り入れることで飛躍的に実行速度が上がるのではないでしょうか。
OpenSpielはアルゴリズムの宝庫です。
とても勉強になるので、ぜひとも多くの人に活用していってもらいたいですね!