基于 Python 的强化学习代理训练环境 TextWorld

码农软件 · 软件分类 · 机器学习/深度学习 · 2019-08-05 14:44:41

软件介绍

TextWorld 是微软开源的一个可扩展的引擎,可用于生成和模拟文本游戏。你可以使用它来训练强化学习(RL)代理,以学习语言理解、记忆、规划和探索等。 

TextWorld 采用 Python 编写,可视为用于在基于文本的游戏上进行训练和测试强化学习(RL)代理的沙盒环境,它还可运行现有的基于文本的游戏,或用来评估 AI 代理在复杂设置中的表现。

TextWorld 包含两个主要组件:游戏生成器和游戏引擎。游戏生成器将高级游戏规范(例如房间数、对象数、游戏长度和获胜条件)转换为 Inform 7 语言的可执行游戏源代码。游戏引擎是一个简单的推理机器,通过使用简单的算法,如一步向前和向后链接,确保生成的游戏的每一步都是有效的。

本文地址:https://codercto.com/soft/d/11703.html

剑指Offer:名企面试官精讲典型编程题(第2版)

剑指Offer:名企面试官精讲典型编程题(第2版)

何海涛 / 电子工业出版社 / 2017-5 / 65.00

《剑指Offer:名企面试官精讲典型编程题(第2版)》剖析了80个典型的编程面试题,系统整理基础知识、代码质量、解题思路、优化效率和综合能力这5个面试要点。《剑指Offer:名企面试官精讲典型编程题(第2版)》共分7章,主要包括面试的流程,讨论面试每一环节需要注意的问题;面试需要的基础知识,从编程语言、数据结构及算法三方面总结程序员面试知识点;高质量的代码,讨论影响代码质量的3个要素(规范性、完整......一起来看看 《剑指Offer:名企面试官精讲典型编程题(第2版)》 这本书的介绍吧!

RGB转16进制工具
RGB转16进制工具

RGB HEX 互转工具

随机密码生成器
随机密码生成器

多种字符组合密码

HEX HSV 转换工具
HEX HSV 转换工具

HEX HSV 互换工具