Alphabet旗下DeepMind开源开发AI项目的元件函式库

栏目: 软件资讯 · 发布时间: 7年前

据中国台湾地区媒体报道,Alphabet旗下AI子公司DeepMind周四开源释出可撰写TensorFlow强化学习(Reinforcement Learning, RL)代理程式的函式库TRFL。DeepMind指出,TRFL(念作truffle)集结了该公司内部开发代理程式如DQN、DDPG及Importance Weighted Actor Learner Architecture所有的重要演算法元件。TRFL目前已可在GitHub上开放下载。

TRFL(读作「truffle」),访问:

https://github.com/deepmind/trfl/

Alphabet旗下DeepMind开源开发AI项目的元件函式库

一般强化学习代理程式包含许多互动元件,像是环境和某个表示值(values)或政策(policy)的深度网路,以及该环境的学习模型、伪奖励函式或重播系统(replay system)。这些元件互动很巧妙,因而在大型运算图谱(computation graphs)中不易发现Bug。Open AI最近就分析强化学习代理程式最受欢迎的开源实作发现,10个代理程式有6个有很小的瑕疵被社区发现且经作者证实。

解决上述问题及协助研究的方法之一是将完整的代理程式实作开源出来。这些代理程式的程式码对复制研究很有用,但问题是难以修改和扩充。另一个方法则是将共通建构元件、经测试过的稳定实作提供出来,这些共通元件也可用于众多不同的RL代理程式。另一个好处是,将这些核心元件集结于单一函式库,加上一致化的API,将更容易和不同来源的想法结合。

TRFL函式库包括实作传统RL演算及更先进技术的函式。像是loss函式及其他运算都有实作于纯Tensorflow 之中。针对value-based及policy-base的强化学习,TRFL也都提供了相应的工具。

DeepMind表示,由于这个函式库广泛用于DeepMind 开发 上,因此他们会持续维护并新增功能,且可望继续释出给开源社区。

本项目势必受到开发人员的欢迎。根据近日GitHub的统计,Tensorflow是平台上第三大开源项目,仅次于微软VS Code和脸书React。


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

数据压缩导论(第4版)

数据压缩导论(第4版)

[美] Khalid Sayood / 贾洪峰 / 人民邮电出版社 / 2014-1 / 129.00

数据压缩已经成为信息革命的一门支撑技术,这场革命已经改变了我们的生活,而在此过程中,数据压缩也变得几乎无处不在。从MP3播放器到智能手机,再到数字电视和数字电影,数据压缩几乎成了所有信息技术的必备要素。 近年来,以大数据为标志的互联网技术高歌猛进。数据规模大、产生速度快、来源多样等特性,导致数据存储和处理都前所未有地复杂。《数据压缩导论(第4版)》作为迄今为止数据压缩领域最全面而深入的著作,......一起来看看 《数据压缩导论(第4版)》 这本书的介绍吧!

Base64 编码/解码
Base64 编码/解码

Base64 编码/解码

XML、JSON 在线转换
XML、JSON 在线转换

在线XML、JSON转换工具

HSV CMYK 转换工具
HSV CMYK 转换工具

HSV CMYK互换工具