MIT CSAIL开发出新式AI可随时间推移追踪目标变化

栏目: 数据库 · 发布时间: 6年前

网易科技讯9月15日消息，据VentureBeat报道，人类利用对物理世界的隐含理解来预测物体的运动，并推断它们之间的相互作用，但机器人很难实现这些逻辑上的飞跃。不过，在麻省理工学院（MIT）下属计算机科学与人工智能实验室（CSAIL）发布的最新论文中，研究人员描述了一个被称为“时间关系网络”(TRN)的人工智能系统，它本质上可以了解物体随时间如何变化。

MIT CSAIL并不是第一个开发类似技术的公司，百度和谷歌也正在研究人工智能辅助时空建模技术。但是MIT的团队声称，他们的方法在之前方法的准确性和效率之间取得了很好的平衡。论文的第一作者周伯磊（Bolei Zhou）解释称：“我们建立的AI系统可识别物体的变化，而不是物体的外观。这套系统不会检查所有的帧，它会挑选关键帧，然后利用帧的时间关系来识别发生了什么。这提高了系统的效率，并使其实时准确运行。”

研究人员在三个数据集上训练了一个卷积神经网络——这是一种机器学习模型，它非常擅长分析视觉图像。这些数据集包括TwentyBN的Something-Something（包括174个动作类别的20000多个视频）、Jester（包含27个手势的15万个视频）以及卡内基梅隆大学的Charades（包含157个分类活动的10000个视频）。

随后，研究人员将这个卷积神经网络松散地放在视频文件中，通过对帧进行分组排序，并确定屏幕上的对象与学习活动相匹配的概率，比如撕下一张纸，或者举起一只手。那么结果如何呢？该模型对Jester数据集实现了95%的准确识别，并且在有限信息量情况下超过了现有的预测活动模型。

在只处理了25%的视频帧后，它打破了基准，甚至能够区分“假装打开一本书”和“真正打开一本书”等动作。在未来的研究中，研究团队计划通过实现对象识别和添加“直观物理”(即了解对象的真实世界属性），来改进模型的复杂性。

周伯磊表示：“因为我们知道这些视频里的很多物理知识，所以我们可以训练模型来学习这些物理定律，并利用它们来识别新的视频。我们也开源了所有的代码和模型。‘活动理解’现在是人工智能的一个令人兴奋的领域。”（小小）

本文来源：网易科技报道责任编辑：张洁_NT5630

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络，本站转载出于传递更多信息之目的，版权归原作者或者来源机构所有，如转载稿涉及版权问题，请联系我们。

码农书籍

素数之恋

(美)约翰·德比希尔 / 陈为蓬 / 上海科技教育出版社 / 2008-12-01 / 34.00元

1859年8月，没什么名气的32岁数学家黎曼向柏林科学院提交了一篇论文，题为“论小于一个给定值的素数的个数”。在这篇论文的中间部分，黎曼作了一个附带的备注——一个猜测，一个假设。他向那天被召集来审查论文的数学家们抛出的这个问题，结果在随后的年代里给无数的学者产生了近乎残酷的压力。时至今日，在经历了150年的认真研究和极力探索后，这个问题仍然悬而未决。这个假设成立还是不成立？已经越来越清楚，......一起来看看《素数之恋》这本书的介绍吧!

码农工具

MIT CSAIL开发出新式AI可随时间推移追踪目标变化

素数之恋

JS 压缩/解压工具

XML、JSON 在线转换

UNIX 时间戳转换