gym-super-mario-bros游戏环境笔记
gym-super-mario-bros游戏环境笔记
最近在学习Intrinsic Reward Model相关的paper,super-mario-bros可以说是算法性能测试的标配游戏环境了,可惜之前太多关注点都放在Atari上,特此开一篇笔记记录一下内容,以备后查。
简介
项目地址https://pypi.org/project/gym-super-mario-bros/
安装
pip install nes-py
pip install gym-super-mario-bros
需要在Ubuntu下安装,Windows不行。
Demo
游戏结束的条件应该有两个:3条命没了,或者超时了。具体实践时应该要设置一个最大探索长度。
Gym demo
from nes_py.wrappers import JoypadSpace
import gym_super_mario_bros
from gym_super_mario_bros.actions import SIMPLE_MOVEMENT
env = gym_super_mario_bros.make('SuperMarioBros-v0')
env = JoypadSpace(env, SIMPLE_MOVEMENT)
done = True
for step in