基于 Python 的强化学习代理训练环境 TextWorld

码农软件 · 软件分类 · 机器学习/深度学习 · 2019-08-05 14:44:41

软件介绍

TextWorld 是微软开源的一个可扩展的引擎,可用于生成和模拟文本游戏。你可以使用它来训练强化学习(RL)代理,以学习语言理解、记忆、规划和探索等。 

TextWorld 采用 Python 编写,可视为用于在基于文本的游戏上进行训练和测试强化学习(RL)代理的沙盒环境,它还可运行现有的基于文本的游戏,或用来评估 AI 代理在复杂设置中的表现。

TextWorld 包含两个主要组件:游戏生成器和游戏引擎。游戏生成器将高级游戏规范(例如房间数、对象数、游戏长度和获胜条件)转换为 Inform 7 语言的可执行游戏源代码。游戏引擎是一个简单的推理机器,通过使用简单的算法,如一步向前和向后链接,确保生成的游戏的每一步都是有效的。

本文地址:https://codercto.com/soft/d/11703.html

算法

算法

Robert Sedgewick、Kevin Wayne / 人民邮电出版社 / 2012-3 / 99.00元

《算法(英文版•第4版)》作为算法领域经典的参考书,全面介绍了关于算法和数据结构的必备知识,并特别针对排序、搜索、图处理和字符串处理进行了论述。第4版具体给出了每位程序员应知应会的50个算法,提供了实际代码,而且这些Java代码实现采用了模块化的编程风格,读者可以方便地加以改造。本书配套网站提供了本书内容的摘要及更多的代码实现、测试数据、练习、教学课件等资源。 《算法(英文版•第4版)》适合......一起来看看 《算法》 这本书的介绍吧!

JSON 在线解析
JSON 在线解析

在线 JSON 格式化工具

XML 在线格式化
XML 在线格式化

在线 XML 格式化压缩工具

HSV CMYK 转换工具
HSV CMYK 转换工具

HSV CMYK互换工具