RL Coach 1.0.0，Python 强化学习框架

栏目: 软件资讯 · 发布时间: 6年前

内容简介：RL Coach，这是一个用于培训和评估强化学习代理的开源框架。具体内容： 1.0.0 版本推出融合了“更新”和“更强大”的算法，同时提高了 RL Coach 的 API 的可用性。RL Coach 1.0.0 总共添加了 27 种强化学习模型，...

RL Coach，这是一个用于培训和评估强化学习代理的开源框架。具体内容：

1.0.0 版本推出融合了“更新”和“更强大”的算法，同时提高了 RL Coach 的 API 的可用性。RL Coach 1.0.0 总共添加了 27 种强化学习模型，具体而言，这些模型由引导它们达到指定目标的奖励反馈循环驱动，以及支持使用Coach作为 Python 库的API。此外，还有改进的文档和未指定的bug修复，以及一般的性能增强。
RL Coach 1.0.0 很好地发挥了批量强化学习，并启用了所谓的关闭策略评估(OPE)，它测试的稳健性的学习策略(即规则集，指定 AI 代理在所有意外情况下应该做什么)的数据获取的基础上使用其他策略。
另外，它还增加了对几个新的强化学习代理的支持，包括 Sample Efficient Actor-Critic with Experience Replay (宏碁), Soft Actor-Critic(SAC)和双延迟深确定性策略梯度(TD3)。

官方指出，它只在 Ubuntu 16.04 LTS 和 Python3.5 上进行了测试。它与 OpenAI 的同名 OpenAI Gym 一起使用。

详情见说明

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持码农网

查看所有标签

本站部分资源来源于网络，本站转载出于传递更多信息之目的，版权归原作者或者来源机构所有，如转载稿涉及版权问题，请联系我们。

码农书籍

痛点

马丁·林斯特龙 / 陈亚萍 / 中信出版集团股份有限公司 / 2017-4-1 / CNY 49.00

互联网经济迅猛发展，大数据成为分析用户需求的一种惯性路径。世界首席品牌营销专家林斯特龙则指出，大数据连接了千百万的数据点，可以准确地产生相互关系。但是，当人类按照自己的习惯行动时，大数据分析通常不会十分准确。所以挖掘用户需求时，在大数据之外，更重要的是通过对一个小群体的亲身观察和小数据常识，捕捉到这个社会群体所体现出的文化欲望。满足这些用户需求，击中痛点，则意味着将掌握无限的商机。一起来看看《痛点》这本书的介绍吧!

码农工具

RL Coach 1.0.0，Python 强化学习框架

痛点

JS 压缩/解压工具

在线进制转换器

HEX CMYK 转换工具