RL Coach 1.0.0,Python 强化学习框架

栏目: 软件资讯 · 发布时间: 5年前

内容简介:RL Coach,这是一个用于培训和评估强化学习代理的开源框架。具体内容: 1.0.0 版本推出融合了“更新”和“更强大”的算法,同时提高了 RL Coach 的 API 的可用性。RL Coach 1.0.0 总共添加了 27 种强化学习模型,...

RL Coach,这是一个用于培训和评估强化学习代理的开源框架。具体内容:

  • 1.0.0 版本推出融合了“更新”和“更强大”的算法,同时提高了 RL Coach 的 API 的可用性。RL Coach 1.0.0 总共添加了 27 种强化学习模型,具体而言,这些模型由引导它们达到指定目标的奖励反馈循环驱动,以及支持使用Coach作为 Python 库的API。此外,还有改进的文档和未指定的bug修复,以及一般的性能增强。
  • RL Coach 1.0.0 很好地发挥了批量强化学习,并启用了所谓的关闭策略评估(OPE),它测试的稳健性的学习策略(即规则集,指定 AI 代理在所有意外情况下应该做什么)的数据获取的基础上使用其他策略。
  • 另外,它还增加了对几个新的强化学习代理的支持,包括 Sample Efficient Actor-Critic with Experience Replay (宏碁),  Soft Actor-Critic(SAC)和双延迟深确定性策略梯度(TD3)。

官方指出,它只在 Ubuntu 16.04 LTS 和 Python3.5 上进行了测试。它与 OpenAI 的同名 OpenAI Gym 一起使用。

详情见说明


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

数据结构与算法分析

数据结构与算法分析

[美]Mark Allen Weiss / 张怀勇 / 人民邮电出版社 / 2007年 / 49.00元

《数据结构与算法分析:C++描述(第3版)》是数据结构和算法分析的经典教材,书中使用主流的程序设计语言C++作为具体的实现语言。书的内容包括表、栈、队列、树、散列表、优先队列、排序、不相交集算法、图论算法、算法分析、算法设计、摊还分析、查找树算法、k-d树和配对堆等。《数据结构与算法分析:C++描述(第3版)》适合作为计算机相关专业本科生的数据结构课程和研究生算法分析课程的教材。本科生的数据结构课......一起来看看 《数据结构与算法分析》 这本书的介绍吧!

XML、JSON 在线转换
XML、JSON 在线转换

在线XML、JSON转换工具

UNIX 时间戳转换
UNIX 时间戳转换

UNIX 时间戳转换

RGB HSV 转换
RGB HSV 转换

RGB HSV 互转工具