Alphabet旗下DeepMind开源开发AI项目的元件函式库

栏目: 软件资讯 · 发布时间: 6年前

据中国台湾地区媒体报道，Alphabet旗下AI子公司DeepMind周四开源释出可撰写TensorFlow强化学习（Reinforcement Learning， RL）代理程式的函式库TRFL。DeepMind指出，TRFL（念作truffle）集结了该公司内部开发代理程式如DQN、DDPG及Importance Weighted Actor Learner Architecture所有的重要演算法元件。TRFL目前已可在GitHub上开放下载。

TRFL（读作「truffle」），访问：

https://github.com/deepmind/trfl/

Alphabet旗下DeepMind开源开发AI项目的元件函式库

一般强化学习代理程式包含许多互动元件，像是环境和某个表示值（values）或政策（policy）的深度网路，以及该环境的学习模型、伪奖励函式或重播系统（replay system）。这些元件互动很巧妙，因而在大型运算图谱（computation graphs）中不易发现Bug。Open AI最近就分析强化学习代理程式最受欢迎的开源实作发现，10个代理程式有6个有很小的瑕疵被社区发现且经作者证实。

解决上述问题及协助研究的方法之一是将完整的代理程式实作开源出来。这些代理程式的程式码对复制研究很有用，但问题是难以修改和扩充。另一个方法则是将共通建构元件、经测试过的稳定实作提供出来，这些共通元件也可用于众多不同的RL代理程式。另一个好处是，将这些核心元件集结于单一函式库，加上一致化的API，将更容易和不同来源的想法结合。

TRFL函式库包括实作传统RL演算及更先进技术的函式。像是loss函式及其他运算都有实作于纯Tensorflow 之中。针对value-based及policy-base的强化学习，TRFL也都提供了相应的工具。

DeepMind表示，由于这个函式库广泛用于DeepMind 开发上，因此他们会持续维护并新增功能，且可望继续释出给开源社区。

本项目势必受到开发人员的欢迎。根据近日GitHub的统计，Tensorflow是平台上第三大开源项目，仅次于微软VS Code和脸书React。

以上就是本文的全部内容，希望本文的内容对大家的学习或者工作能带来一定的帮助，也希望大家多多支持码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络，本站转载出于传递更多信息之目的，版权归原作者或者来源机构所有，如转载稿涉及版权问题，请联系我们。

码农书籍

乔布斯离开了，马斯克来了

[日]竹内一正 / 干太阳 / 中信出版社 / 2015-11

在电动汽车的创新上，特斯拉抓住了一个群体的独特需求，外形很酷，不烧油，智能化控制。所有的颠覆式创新都不是敲锣打鼓来的，而是隐藏在一片噪声里，马斯克给我们带来的特斯拉虽然不尽完美，但他做产品的思维和执着于未来的勇气，值得学习。埃隆•马斯克创办公司也不是为了赚钱，而是为了拯救人类和地球，电动汽车、太阳能发电、宇宙火箭，不管是哪一项都足以令一个国家付出巨大的代价去研究开发，但埃隆•马斯克却一个人在做这些......一起来看看《乔布斯离开了，马斯克来了》这本书的介绍吧!

码农工具

Alphabet旗下DeepMind开源开发AI项目的元件函式库

TRFL（读作「truffle」），访问：

乔布斯离开了，马斯克来了

JSON 在线解析

HTML 编码/解码

HSV CMYK 转换工具