(1) 分散型強化学習手法の最近の動向を, 特に MuZero (2019年11月), Agent57 (2020年3月)を中心に紹介します.
(2) 分散計算フレームワーク Ray によってシンプルな分散型強化学習手法を実装し, Amazon EC2上にクラスタを構築して分散計算を行う方法を解説します.
- 当日紹介したソースコードと設定ファイル
https://github.com/susumuota/distributed_experience_replay
- Do2dle勉強会のconnpassページ
https://do2dle.connpass.com/event/178184/