网易科技讯9月15日消息,据VentureBeat报道,人类利用对物理世界的隐含理解来预测物体的运动,并推断它们之间的相互作用,但机器人很难实现这些逻辑上的飞跃。不过,在麻省理工学院(MIT)下属计算机科学与人工智能实验室(CSAIL)发布的最新论文中,研究人员描述了一个被称为“时间关系网络”(TRN)的人工智能系统,它本质上可以了解物体随时间如何变化。
MIT CSAIL并不是第一个开发类似技术的公司,百度和谷歌也正在研究人工智能辅助时空建模技术。但是MIT的团队声称,他们的方法在之前方法的准确性和效率之间取得了很好的平衡。论文的第一作者周伯磊(Bolei Zhou)解释称:“我们建立的AI系统可识别物体的变化,而不是物体的外观。这套系统不会检查所有的帧,它会挑选关键帧,然后利用帧的时间关系来识别发生了什么。这提高了系统的效率,并使其实时准确运行。”
研究人员在三个数据集上训练了一个卷积神经网络——这是一种机器学习模型,它非常擅长分析视觉图像。这些数据集包括TwentyBN的Something-Something(包括174个动作类别的20000多个视频)、Jester(包含27个手势的15万个视频)以及卡内基梅隆大学的Charades(包含157个分类活动的10000个视频)。
随后,研究人员将这个卷积神经网络松散地放在视频文件中,通过对帧进行分组排序,并确定屏幕上的对象与学习活动相匹配的概率,比如撕下一张纸,或者举起一只手。那么结果如何呢?该模型对Jester数据集实现了95%的准确识别,并且在有限信息量情况下超过了现有的预测活动模型。
在只处理了25%的视频帧后,它打破了基准,甚至能够区分“假装打开一本书”和“真正打开一本书”等动作。在未来的研究中,研究团队计划通过实现对象识别和添加“直观物理”(即了解对象的真实世界属性),来改进模型的复杂性。
周伯磊表示:“因为我们知道这些视频里的很多物理知识,所以我们可以训练模型来学习这些物理定律,并利用它们来识别新的视频。我们也开源了所有的代码和模型。‘活动理解’现在是人工智能的一个令人兴奋的领域。”(小小)
本文来源:网易科技报道 责任编辑:张洁_NT5630
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网
猜你喜欢:- 记一次ajax的JSESSIONID 变化解决、非跨域变化
- ReactNative字体大小不随系统字体大小变化而变化
- 三月新变化
- 2019 年总结:拥抱变化
- InnoDB mutex 变化历程
- 变化莫测的mysqldump
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
iOS应用逆向工程 第2版
沙梓社、吴航 / 机械工业出版社 / 2015-4-1 / 79.00
你是否曾因应用上线的第一天即遭破解而无奈苦恼,想要加以防范,却又束手无策? 你是否曾为某一应用深深折服,想要借鉴学习,却又无从下手? 你是否已不满足于public API,想要进军Cydia开发,却又求学无门? 你是否已产生“不识Apple真面目,只缘身在App Store中”的危机感,想要通过阅读来一窥这冰山一角外的整个北极,却又找不到合适的书? 你是否已经因无法跨越开发......一起来看看 《iOS应用逆向工程 第2版》 这本书的介绍吧!