源码
GitHub源码分为环境和算法两个部分:
1、Multi-Agent Particle Environment
2、Multi-Agent Deep Deterministic Policy Gradient (MADDPG)
环境配置
下载 Multi-Agent Particle Environment 源码,阅读 README.md 可知需要先配置:
Python (3.5.4), OpenAI gym (0.10.5), numpy (1.14.5), tensorflow(1.8.0)
注意对应的包的版本,我使用的是 Pycharm + python3.6。
根据网上的经验,这里gym不可以安装最新的版本,否则会报prng.py和另一个模块的缺失。(参考:OpenAI MADDPG配置)
然后在 Pycharm 自带的 terminal 或进入 cmd,在下载的工程的根目录执行 pip install -e .
,将会自动下载补全剩余需要的包。等待成功安装,输入环境测试指令 python bin/interactive.py --scenario simple.py
。我的实验结果如下。