在算法中练习百年后，机器人的手能比你更灵活吗？

栏目: 编程工具 · 发布时间: 7年前

编者按：位于硅谷的非营利组织OpenAI的研究人员开发的AI系统Dactyl能使机器手像人类一样灵活操纵立方体。本文经授权译自MIT Technology Review原标题为" An AI-driven robot hand spent a hundred years teaching itself to rotate a cube"的文章。

Dactyl AI的研究人员成功研究出一种自学算法，它能让机器人的手具有很高的灵活性。他们研究出的算法使机器手能灵活地操纵一个立方体，这个过程在计算机模拟中相当于进行了百年的练习（尽管实际只有几天的时间）。

机器人的手还远不及人类的敏捷，而且如果想应用在工厂或仓库里也显得太笨拙了。即便如此，这项研究依然显示了机器学习的潜力。它还表明，有一天，机器人可能会在虚拟世界中自学新技能，这将大大加快编程或训练它们的进程。

这个机器人系统被称为“Dactyl”，是由位于硅谷的非营利组织OpenAI的研究人员开发的。它使用了一个来自英国公司称为“影子”的现成的机器手，一个普通的相机，以及一个已经掌握了一个庞大的多人在线视频游戏的DotA算法，它使用了同样的自学方法。

该算法使用一种称为强化学习的机器学习技术。Dactyl的任务是操纵一个立方体，把不同的面翻到上面来。通过不断的试错，会产生预期的结果。

视频显示，Dactyl能够非常敏捷地旋转立方体。它自动地找出了人类常用的几个抓点。但这项研究也显示了人工智能还有很长的路要走：在经过了数百年的虚拟训练之后，机器人成功地操纵了魔方的概率只有13/50，这远远超过了儿童所需要的时间。

麻省理工学院名誉教授、Rethink Robotics公司的创始人Rodney Brooks表示：“短期内，它不适合被应用于工业流程，但研究依然是一件好事。” Rethink Robotics公司是一家生产更智能工业机器人的初创公司。

强化学习的灵感来自于动物通过积极反馈学习的方式。它最初在几十年前就被提出了，但随着人工神经网络的进步，在最近几年才被证明是可行的。Alphabet旗下的DeepMind利用强化学习技术创建了AlphaGo。这是一个计算机程序，它学会了高超的技能来玩极其复杂和微妙的棋盘游戏。

其他机器人研究人员对这种方法进行了一段时间的测试，但由于模仿现实世界的复杂性和不可预测性，他们一直难有突破。OpenAI的研究人员通过在虚拟世界中引入随机变量来解决这个问题，这样机器人就可以学习如何解释诸如摩擦、机器人硬件噪音以及立方体部分处于视线之外的问题。

该机器人背后的工程师之一Alex Ray表示，通过赋予它更强的处理能力和引入更多的随机性，可以提高Dactyl的性能。“我认为我们还没有达到极限，”他说。Ray补充说，目前还没有计划将这项技术商业化。他的团队专注于开发最强的通用学习方法。

“这很难做好，”密歇根大学专门研究机器操纵的专家Dmitry Berenson说，“目前还不清楚最新的机器学习方法将会带来多大影响。我们付出了很多努力来为特定的任务提供合适的方法。”但他认为，模拟学习可能是非常有用的：“如果我们能够真正地跨越‘现实差距’，学习就会变得更加容易。

编译组出品。译者：刘麦麦 Jane，编辑：郝鹏程。

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络，本站转载出于传递更多信息之目的，版权归原作者或者来源机构所有，如转载稿涉及版权问题，请联系我们。

码农书籍

新零售(实体店O2O营销与运营实战)

苗李宁 / / 化学工业 / 2018-08-01 / 58.0

一起来看看《新零售(实体店O2O营销与运营实战)》这本书的介绍吧!

码农工具

在算法中练习百年后，机器人的手能比你更灵活吗？

新零售(实体店O2O营销与运营实战)

MD5 加密

XML、JSON 在线转换

XML 在线格式化