Python 强化学习研究框架 Coach

码农软件 · 软件分类 · 机器学习/深度学习 · 2019-08-06 11:57:00

软件介绍

Coach 是 Intel Nervana 开源的一个强化学习研究框架,包含许多最先进的算法的实现。该框架利用多核 CPU 处理能力,用于训练和评估增强学习 Agent。Coach 包含一些领先的增强学习算法的多线程实现,适用于各种游戏和机器人环境。

Coach 是一个 Python 环境,有了 Coach,我们就有可能通过结合不同的模块对智能体建模了,也能在不同的环境中训练智能体。可使用的环境,让我们能在不同的实务领域测试智能体,比如机器人、自动驾驶汽车、游戏等。Coach 能够收集训练过程的统计数据,并支持高级可视化技术,从而 debug 训练的智能体。

Coach 有非常易于使用的 API,用于实验新的 RL 算法,并允许新环境的简单集成来解答。 基本的 RL 组件(算法、环境、神经网络架构、探索策略等)能很好的解耦,因此能无痛扩展和重用现有的组件。

简单示例:

python coach.py -p CartPole_DQN -r


本文地址:https://codercto.com/soft/d/11764.html

IT大败局

IT大败局

Merrill R.Chapman、周良忠 / 周良忠 / 电子工业出版社 / 2004-8-1 / 35.00

这是一本由作者亲身经历写就的MBA式教案。通过作者那专业人士的敏锐、活泼流畅的文笔和美国人特有的幽默,本书为我们剖析了IT界十个有代表性且影响深远的愚蠢败局。这十个败局涉及企业经营的十个主要方面,它们是:产业标准的魔力,“缩水”产品的阴霾,产品定位的泥潭,市场关系的教训,巨型企业的困惑,企业并购的陷阱,品牌战略的迷茫,技术导向的失衡,企业公关的真谛和科技虚幻的诱惑。 书中有许多鲜为人......一起来看看 《IT大败局》 这本书的介绍吧!

HTML 压缩/解压工具
HTML 压缩/解压工具

在线压缩/解压 HTML 代码

MD5 加密
MD5 加密

MD5 加密工具

正则表达式在线测试
正则表达式在线测试

正则表达式在线测试