内容简介:机器福尔摩斯?DeepMind 要教会 AI 像人类一样进行推理
逻辑分析和理性思考能力,是人类智力的核心,它们将人类与动物和大多数机器区分开。如果把这些能力赋予给 AI,它将能够像人类一样通过现象推理事实,甚至比人类做的更好。但是,目前的深度学习算法还不够先进,仅仅依赖于符号关系推理证明显然还远远不够。近日,DeepMind 发表了两篇新的论文,文中探讨了深层神经网络如何用非结构化数据进行复杂的关系推理,让 AI 能变得更加“聪明”。
第一篇论文描述了一个 用于逻辑推理的关系网络(RN) ,并证明用它执行一项具有挑战性的任务的时候,AI 的表现甚至超越了人类的水平;另一篇论文描述了一个 视觉互动网络(VIN),它可以基于纯粹的视觉观察来预测物理对象的未来状态 , 使得 AI 能在简单的视觉信息中进行更高级的逻辑推理 。
神经关系网络(RN)
利用神经网络来进行关系推理并不是一个新的发现,近年来已经有许多团队在研究这个领域,比如去年,马萨诸塞大学信息与计算机科学学院就利用神经网络在他们的文章和大型知识库中进行了关系推理。
但 DeepMind 的研究则更进一步,他们在论文中提出了 RN 这种新的关系网络进行推理。 RN 模块可以插入到现有的神经网络架构中,并且采用非结构化的输入(如一张图片或者一系列句子)给出对象间的隐含关系。
假设在桌子上堆放着各种形状的物体,有球体、立方体等。为了了解他们之间的关系,RN 网络必须从这些图像中提取像素流,确定有哪些对象内容,并进行对比。在这个过程中,网络并不会被告知物理对象是什么,一切都要它自己弄清楚。找到对象之后,RN 需要将他们分组并通过不断的对比建立他们之间的关系(比如球体体积大于立方体),最后输出关系结果。
研究人员利用 CLEVR 视觉问题回答任务对这个模型进行了测试。DeepMind 发博文称:“使用标准的视觉问题回答体系的 CLEVR 测试准确率是 68%,正常人类的准确率是 92%,而 RN 关系网络的准确率达到了 95.5%。”
视觉互动网络(VIN)
在关系推理中,另外一个重点是要预测物理场景中对象的未来状态。在现实生活中,人类不仅可以推测出一些特定物体的位置,还能够预测在接下来几秒甚至更长一段时间它的状态。比如,你将一颗足球踢向墙壁,你的大脑会预测到球撞击墙面会发生什么,以及之后的运动轨迹如何。这些预测是由一个复杂的认知系统引导的,
DeepMind 开发的 “视觉互动网络”模拟了人类的这种能力。通过视觉模块和物理推理模块的配合,利用物体与物体之间相互作用的不同类型进行推理 ,它能在几帧的视频中推断出物体的运动状态,以及未来几个步骤中物体的位置。
虽然论文中没有透露视觉互动网络能够预测到物体未来多远的运动状态,但是这两篇论文都展示了解决 AI 关系推理难题的希望。
DeepMind 的高级研究科学家,英国伦敦帝国理工学院教授 Murray Shanahan 说:“我认为在机器学习领域一直存在一种缺陷,人工智能的思想必须在神经网络的指引下进行,一些研究人员一直在探索这种方法。DeepMind 的研究是非常有价值的开始,推理是人工智能必须掌握的能力之一。”
以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网
猜你喜欢:- 数据结构应该教会我们什么?
- 一篇教会你写 90% 的 Shell 脚本
- 如何教会机器读懂设计 v1.1
- 想知道jsonp到底是怎么实现的?看我,包教会!
- 一文教会你如何在 Spring 中进行集成测试,太赞了
- Zookeeper学习系列【一】 教会你Zookeeper的一些基础概念
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。