开启你的强化学习之旅
OpenAI Gym 是由 OpenAI 开发的一个用于开发和比较强化学习(Reinforcement Learning, RL)算法的工具包。 它提供了一系列标准化的环境(如 CartPole、MountainCar、Atari 游戏等),让研究人员和开发者可以快速测试和验证他们的 RL 模型。
Gym 的设计目标是简单、模块化且易于扩展,支持 Python 语言,并与主流深度学习框架(如 TensorFlow、PyTorch)无缝集成。
安装 OpenAI Gym 非常简单,只需一行命令:
pip install gymnasium
注意:自 2023 年起,官方推荐使用 gymnasium(Gym 的社区维护版本),它兼容原 Gym API。
import gymnasium as gym
env = gym.make("CartPole-v1", render_mode="human")
observation, info = env.reset()
for _ in range(1000):
action = env.action_space.sample() # 随机选择动作
observation, reward, terminated, truncated, info = env.step(action)
if terminated or truncated:
observation, info = env.reset()
env.close()
这段代码会打开一个窗口,显示一个小车试图平衡一根杆子的经典控制问题。
CartPole-v1:小车平衡杆子(离散动作)MountainCar-v0:小车上山(离散动作)Pendulum-v1:倒立摆控制(连续动作)Acrobot-v1:双连杆摆(离散动作)gymnasium[atari])