OpenAI Gym 强化学习算法工具包

程序名称:OpenAI Gym

授权协议: MIT

操作系统: 跨平台

开发语言: Python

OpenAI Gym 介绍

OpenAI Gym 是一个用于开发和比较强化学习算法的工具包。

gym 不对代理的结构做任何假设,并且与任何数值计算库兼容,例如 TensorFlow 或 Theano。

有关 OpenAI Gym 的白皮书,请访问 http://arxiv.org/abs/1606.01540,这里有一个 BibTeX
条目,可以在出版物中引用它:

@misc{1606.01540,
  Author = {Greg Brockman and Vicki Cheung and Ludwig Pettersson and Jonas Schneider and John Schulman and Jie Tang and Wojciech Zaremba},
  Title = {OpenAI Gym},
  Year = {2016},
  Eprint = {arXiv:1606.01540},
}

强化学习有两个基本概念:环境(即外部世界)和代理(即你正在编写的算法)。代理向环境发送操作,环境回复观察和奖励(即分数)。

核心的 gym 界面是 Env,它是统一的环境界面。没有代理商界面。以下是应该了解的 Env 方法:

  • reset(self)::重置环境的状态。返回观察。
  • step(self, action):一步一步进入环境。返回观察、奖励、完成、信息。
  • render(self, mode=’human’):渲染一帧环境。默认模式将执行人性化的操作,例如弹出窗口。

可以执行最小的安装:

git clone https://github.com/openai/gym.git
cd gym
pip install -e .

可以直接从 PyPI 进行最小的打包版本安装:

pip install gym

可以立即运行一些环境:

  • 算法
  • toy_text
  • classic_control(需要 pyglet 来渲染)

建议首先使用这些环境,然后再安装其余环境的依赖项。

OpenAI Gym 官网

https://gym.openai.com/

相关编程语言

欧盟第7框架计划(FP7)的LarKC项目的目标是开发大规模...
Salad 是一种有效且灵活的实现著名的异常检测方法回...
multilanguage 是一个多语开发工具包,用于缓存多语...
go-cortex 是一个服务,通过倾听你的句子,并视图理...
DKPro Core 是基于 Apache UIMA 框架之上的自然语言...
NLTK 会被自然地看作是具有栈结构的一系列层,这些层...