Google 开源新型强化学习框架 Dopamine

栏目: IT资讯 · 发布时间: 7年前

内容简介：Google 近日宣布开源一个新的基于 Tensorflow 的框架 —— Dopamine，旨在为新手和资深 RL（强化学习）研究人员提供灵活性、稳定性和可重复性。该框架受大脑中的奖励动机行为启发，反映了神经科学与强化学习研究之...

Google 近日宣布开源一个新的基于 Tensorflow 的框架 —— Dopamine，旨在为新手和资深 RL（强化学习）研究人员提供灵活性、稳定性和可重复性。该框架受大脑中的奖励动机行为启发，反映了神经科学与强化学习研究之间的强历史联系，旨在实现可以推动激进发现的投机性研究。

Dopamine 的功能亮点

易用性

清晰性和简洁性是该框架设计中的两个关键考虑因素。Google 提供的代码非常紧凑（约 15 个 Python 文件）且文档完善，Google 希望这种简单性能使研究人员更轻松地理解代理的内部运作并快速尝试新的想法。

复用性

Google 非常看重可复用性在强化学习研究中的重要性。为此，他们为代码提供完整的测试覆盖率;，并遵循 Machado 等学者给出的建议，使用街机学习环境（Arcade Learning Environment）标准化经验评估。

基准测试

对于新的研究人员而言，能够根据已有方法快速对自己的想法进行基准测试是非常重要的。因此，Google 提供四个 agent 的完整训练数据，包括Arcade Learning Environment 支持的 60 个游戏，格式为 Python pickle 文件（对于使用谷歌框架训练的智能体）和 JSON 数据文件（用于对比其他框架训练的智能体）。Google 还额外提供一个网站，可在上面快速查看所有 60 款游戏的 agent 可视化训练运行情况。

Google 开源新型强化学习框架 Dopamine

更多细节可查阅开源说明和项目文档。

【声明】文章转载自：开源中国社区 [http://www.oschina.net]

以上就是本文的全部内容，希望本文的内容对大家的学习或者工作能带来一定的帮助，也希望大家多多支持码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络，本站转载出于传递更多信息之目的，版权归原作者或者来源机构所有，如转载稿涉及版权问题，请联系我们。

码农书籍

Struts 2 in Action

Don Brown、Chad Davis、Scott Stanlick / Manning Publications / 2008.3 / $44.99

The original Struts project revolutionized Java web development and its rapid adoption resulted in the thousands of Struts-based applications deployed worldwide. Keeping pace with new ideas and trends......一起来看看《Struts 2 in Action》这本书的介绍吧!

码农工具

Google 开源新型强化学习框架 Dopamine

Dopamine 的功能亮点

Struts 2 in Action

HTML 压缩/解压工具

XML、JSON 在线转换

html转js在线工具