gym初步使用

g y m 初 步 使 用 gym初步使用 gym使


  • 安装
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple gym

解决Pong-v0环境问题

pip install --no-index -f https://github.com/Kojoley/atari-py/releases atari_py

GYM-OPENAI-环境平台


0.导入工具包

import gym
import random
import numpy as np
import matplotlib.pyplot as plt

1.激活environment , 查看基本信息

1) 激活环境

env = gym.make('Pong-v0')

2) 查看基本信息,包括state信息的shape,action space的大小

# state信息
env.observation_space

在这里插入图片描述

# state's shape
env.observation_space.shape

在这里插入图片描述

# action信息
env.action_space

在这里插入图片描述

# action个数
env.action_space.n

在这里插入图片描述

2.初始化环境,查看state具体信息

state = env.reset()
state

在这里插入图片描述

state.shape

在这里插入图片描述

3. 执行action并可视化效果

1) 执行action

state = env.reset()
env.render()

在这里插入图片描述

new_state,reward,done,info = env.step(0)   # 0 表示第一个Action
reward,done,info

在这里插入图片描述

new_state

在这里插入图片描述

new_state -state

在这里插入图片描述

plt.imshow(state)

在这里插入图片描述

plt.imshow(env.render(mode='rgb_array'))

在这里插入图片描述

2) 可视化Action

state = env.reset()
done =False
action =3
t = 0
for _ in range(2000):
    t += 1
    env.render()
    state,reward,done,_ = env.step(action)
    if done:
        break
t

在这里插入图片描述

4.关闭环境

env.close()
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值