谷歌发布开源 Dopamine 2.0，让强化学习变得更灵活

栏目: 软件资讯 · 发布时间: 7年前

内容简介：强化学习（RL）已成为最受欢迎的机器学习领域之一，并且在过去几年中取得了许多重大进展。因此，研究人员和教育工作者越来越需要获得一个清晰可靠的 RL 研究和教育框架。去年 8 月，谷歌发布了一款今天，谷歌发布 Dopamine 2.0，为强化学习提供了更高的灵活性以及更多的测试环境。去年八月，谷歌发布了 Dopamine，这是一款灵活的强化学习框架。初始版本专注于特定类型的 RL 研究：基于 Arcade 学习环境（一个成熟的、易于理解的基准）和四个基于值的代理 DQN、C51、Rainbow 代理的简化版本

强化学习（RL）已成为最受欢迎的机器学习领域之一，并且在过去几年中取得了许多重大进展。因此，研究人员和教育工作者越来越需要获得一个清晰可靠的 RL 研究和教育框架。去年 8 月，谷歌发布了一款全新的开源强化学习框架 Dopamine ，该框架基于 TensorFlow，主打灵活性、稳定性、复现性，能够提供快速的基准测试。

今天，谷歌发布 Dopamine 2.0，为强化学习提供了更高的灵活性以及更多的测试环境。

去年八月，谷歌发布了 Dopamine，这是一款灵活的强化学习框架。初始版本专注于特定类型的 RL 研究：基于 Arcade 学习环境（一个成熟的、易于理解的基准）和四个基于值的代理 DQN、C51、Rainbow 代理的简化版本以及隐式分位数网络代理实现的。

开源地址： https://github.com/google/dopamine

据官方博客介绍：

开发小组收到的最常见的请求之一是对更多环境的支持。这证实了他们在内部看到的情况，在测试新算法时，OpenAI 的 Gym 支持的简单环境非常有用。于是，谷歌正式发布 Dopamine 2.0，这一版本包括了对离散域 Gym 环境 (如离散状态和动作) 的支持。框架的核心保持不变，只是简单地概括了与环境的接口。为了向后兼容，用户仍然可以下载 1.0 版本。

此外，新版本还包括两个经典控制环境的默认配置：CartPole 和 Acrobot；在这些环境中，用户可以在几分钟内训练 Dopamine 代理。与标准 Atari 2600 游戏的训练时间（标准 GPU 上大约 5 天）相比，这些环境允许研究人员在更大规模的 Atari 游戏上测试比之前更快地迭代研究思路。新版本还包括一个合作实验室，演示如何在 Cartpole 和 Acrobot 上训练代理。最后，GymPreprocessing 类为如何将 Dopamine 与其他自定义环境一起使用提供了示例。

拓展阅读

吊打 OpenAI！谷歌重磅开源强化学习框架 Dopamine

以上所述就是小编给大家介绍的《谷歌发布开源 Dopamine 2.0，让强化学习变得更灵活》，希望对大家有所帮助，如果大家有任何疑问请给我留言，小编会及时回复大家的。在此也非常感谢大家对码农网的支持！

查看所有标签

本站部分资源来源于网络，本站转载出于传递更多信息之目的，版权归原作者或者来源机构所有，如转载稿涉及版权问题，请联系我们。

码农书籍

嵌入式Linux应用开发完全手册

韦东山主编 / 人民邮电出版社 / 2008-8 / 69.00元

本书全部实例代码及相关工具。基于ARM 9+Linux 206平台，从基础讲起，引导读者快速入门，实例丰富，可直接应用于工程实践。本书全面介绍了嵌入式Linux系统开发过程中，从底层系统支持到上层GUI应用的方方面面，内容涵盖Linux操作系统的安装及相关工具的使用、配置，嵌入式编程所需要的基础知识（交叉编译工具的选项设置、Makefile语法、ARM汇编指令等），硬件部件的使用及......一起来看看《嵌入式Linux应用开发完全手册》这本书的介绍吧!

码农工具

谷歌发布开源 Dopamine 2.0，让强化学习变得更灵活

拓展阅读

嵌入式Linux应用开发完全手册

XML、JSON 在线转换

html转js在线工具

UNIX 时间戳转换