Google 开源新型强化学习框架 Dopamine

栏目: IT资讯 · 发布时间: 7年前

内容简介:Google 近日宣布开源一个新的基于 Tensorflow 的框架 —— Dopamine,旨在为新手和资深 RL(强化学习)研究人员提供灵活性、稳定性和可重复性。该框架受大脑中的奖励动机行为启发,反映了神经科学与强化学习研究之...

Google 近日宣布开源一个新的基于 Tensorflow 的框架 —— Dopamine,旨在为新手和资深 RL(强化学习)研究人员提供灵活性、稳定性和可重复性。该框架受大脑中的奖励动机行为启发,反映了神经科学与强化学习研究之间的强历史联系,旨在实现可以推动激进发现的投机性研究。

Dopamine 的功能亮点

易用性

  • 清晰性和简洁性是该框架设计中的两个关键考虑因素。Google 提供的代码非常紧凑(约 15 个 Python 文件)且文档完善,Google 希望这种简单性能使研究人员更轻松地理解代理的内部运作并快速尝试新的想法。

复用性

  • Google 非常看重可复用性在强化学习研究中的重要性。为此,他们为代码提供完整的测试覆盖率;,并遵循 Machado 等学者给出的建议使用街机学习环境(Arcade Learning Environment)标准化经验评估。

基准测试

  • 对于新的研究人员而言,能够根据已有方法快速对自己的想法进行基准测试是非常重要的。因此,Google 提供四个 agent 的完整训练数据,包括Arcade Learning Environment 支持的 60 个游戏,格式为 Python pickle 文件(对于使用谷歌框架训练的智能体)和 JSON 数据文件(用于对比其他框架训练的智能体)。Google 还额外提供一个网站,可在上面快速查看所有 60 款游戏的 agent 可视化训练运行情况。

Google 开源新型强化学习框架 Dopamine

更多细节可查阅开源说明项目文档


【声明】文章转载自:开源中国社区 [http://www.oschina.net]


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

深度探索C++对象模型

深度探索C++对象模型

斯坦利•B.李普曼 (Stanley B. Lippman) / 侯捷 / 电子工业出版社 / 2012-1 / 69.00元

作者Lippman参与设计了全世界第一套C++编译程序cfront,这本书就是一位伟大的C++编译程序设计者向你阐述他如何处理各种explicit(明确出现于C++程序代码中)和implicit(隐藏于程序代码背后)的C++语意。 本书专注于C++面向对象程序设计的底层机制,包括结构式语意、临时性对象的生成、封装、继承,以及虚拟——虚拟函数和虚拟继承。这本书让你知道:一旦你能够了解底层实现模......一起来看看 《深度探索C++对象模型》 这本书的介绍吧!

JS 压缩/解压工具
JS 压缩/解压工具

在线压缩/解压 JS 代码

MD5 加密
MD5 加密

MD5 加密工具

RGB HSV 转换
RGB HSV 转换

RGB HSV 互转工具