在算法中练习百年后,机器人的手能比你更灵活吗?

栏目: 编程工具 · 发布时间: 6年前

编者按:位于硅谷的非营利组织OpenAI的研究人员开发的AI系统Dactyl能使机器手像人类一样灵活操纵立方体。本文经授权译自MIT Technology Review原标题为" An AI-driven robot hand spent a hundred years teaching itself to rotate a cube"的文章。

Dactyl AI的研究人员成功研究出一种自学算法,它能让机器人的手具有很高的灵活性。他们研究出的算法使机器手能灵活地操纵一个立方体,这个过程在计算机模拟中相当于进行了百年的练习(尽管实际只有几天的时间)。

机器人的手还远不及人类的敏捷,而且如果想应用在工厂或仓库里也显得太笨拙了。即便如此,这项研究依然显示了机器学习的潜力。它还表明,有一天,机器人可能会在虚拟世界中自学新技能,这将大大加快编程或训练它们的进程。

这个机器人系统被称为“Dactyl”,是由位于硅谷的非营利组织OpenAI的研究人员开发的。 它使用了一个来自英国公司称为“影子”的现成的机器手,一个普通的相机,以及一个已经掌握了一个庞大的多人在线视频游戏的DotA算法,它使用了同样的自学方法。

该算法使用一种称为强化学习的机器学习技术。Dactyl的任务是操纵一个立方体,把不同的面翻到上面来。通过不断的试错,会产生预期的结果。

视频显示,Dactyl能够非常敏捷地旋转立方体。它自动地找出了人类常用的几个抓点。但这项研究也显示了人工智能还有很长的路要走:在经过了数百年的虚拟训练之后,机器人成功地操纵了魔方的概率只有13/50,这远远超过了儿童所需要的时间。

麻省理工学院名誉教授、Rethink Robotics公司的创始人Rodney Brooks表示:“短期内,它不适合被应用于工业流程,但研究依然是一件好事。” Rethink Robotics公司是一家生产更智能工业机器人的初创公司。

强化学习的灵感来自于动物通过积极反馈学习的方式。它最初在几十年前就被提出了,但随着人工神经网络的进步,在最近几年才被证明是可行的。Alphabet旗下的DeepMind利用强化学习技术创建了AlphaGo。这是一个计算机程序,它学会了高超的技能来玩极其复杂和微妙的棋盘游戏。

其他机器人研究人员对这种方法进行了一段时间的测试,但由于模仿现实世界的复杂性和不可预测性,他们一直难有突破。OpenAI的研究人员通过在虚拟世界中引入随机变量来解决这个问题,这样机器人就可以学习如何解释诸如摩擦、机器人硬件噪音以及立方体部分处于视线之外的问题。

该机器人背后的工程师之一Alex Ray表示,通过赋予它更强的处理能力和引入更多的随机性,可以提高Dactyl的性能。“我认为我们还没有达到极限,”他说。Ray补充说,目前还没有计划将这项技术商业化。他的团队专注于开发最强的通用学习方法。

“这很难做好,”密歇根大学专门研究机器操纵的专家Dmitry Berenson说,“目前还不清楚最新的机器学习方法将会带来多大影响。我们付出了很多努力来为特定的任务提供合适的方法。”但他认为,模拟学习可能是非常有用的:“如果我们能够真正地跨越‘现实差距’,学习就会变得更加容易。

编译组出品。译者:刘麦麦 Jane,编辑:郝鹏程。


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

匠心体验

匠心体验

[法] 艾米丽·布歇 / 吴 博 / 人民邮电出版社 / 2016-11 / 69.00元

本书针对在智能手机和平板电脑的网站及应用程序设计,详细剖析了移动终端服务的用户体验设计要点,阐述了营造舒适的感官体验、甄选内容及功能、提高用户效率、优化等待时间、合理实施教学、情感设计等方面的设计诀窍,并通过大量实例,呈现当今移动终端服务设计中的亮点与雷区。一起来看看 《匠心体验》 这本书的介绍吧!

URL 编码/解码
URL 编码/解码

URL 编码/解码

SHA 加密
SHA 加密

SHA 加密工具

UNIX 时间戳转换
UNIX 时间戳转换

UNIX 时间戳转换