基于 Tensorflow 的强化学习框架 Dopamine

码农软件 · 软件分类 · 机器学习/深度学习 · 2019-08-05 14:12:21

软件介绍

Dopamine 是由 Google AI 实验室推出的一个基于 Tensorflow 的强化学习(RL)框架,旨在为新手和资深 RL 研究人员提供灵活性、稳定性和可重复性。该框架受大脑中的奖励动机行为启发,反映了神经科学与强化学习研究之间的强历史联系,旨在实现可以推动激进发现的投机性研究。

Dopamine 遵循以下设计原则:

  • 简单的实验:让新用户轻松运行基准实验。

  • 灵活的开发:让新用户轻松尝试研究创意。

  • 紧凑而可靠:为少数经过实战考验的算法提供实施方案。

  • 可重复性:促进结果的可重复性。

本文地址:https://codercto.com/soft/d/11701.html

有限与无限的游戏

有限与无限的游戏

[美]詹姆斯·卡斯 / 马小悟、余倩 / 电子工业出版社 / 2013-10 / 35.00元

在这本书中,詹姆斯·卡斯向我们展示了世界上两种类型的「游戏」:「有限的游戏」和「无限的游戏」。 有限的游戏,其目的在于赢得胜利;无限的游戏,却旨在让游戏永远进行下去。有限的游戏在边界内玩,无限的游戏玩的就是边界。有限的游戏具有一个确定的开始和结束,拥有特定的赢家,规则的存在就是为了保证游戏会结束。无限的游戏既没有确定的开始和结束,也没有赢家,它的目的在于将更多的人带入到游戏本身中来,从而延续......一起来看看 《有限与无限的游戏》 这本书的介绍吧!

RGB转16进制工具
RGB转16进制工具

RGB HEX 互转工具

SHA 加密
SHA 加密

SHA 加密工具

RGB CMYK 转换工具
RGB CMYK 转换工具

RGB CMYK 互转工具