内容简介:灵长类动物脸部识别算法被破译,大脑黑箱或根本不存在
不必花费太多心思就从人群中找到熟识的脸,对于绝大多数人而言都是小事一桩。人类的大脑已经这样做了几百万年。
不过,这其中具体涉及的神经系统过程却十分复杂,研究人员也对其倾注了很多年的时间。
6 月 1 日,在 Cell 发表的一项研究表明,猕猴依靠一个数百个神经元组成的集群相互协调,发现某些物理特征,从而对动物的脸进行识别。这一发现也解决了一个多年以来一直困扰科学家的问题。
关于灵长类是如何识别其他动物,尤其是同类的脸,一直以来众说纷纭。美国马里兰州贝塞斯达心理健康研究所的神经科学家 David Leopold 在接受 Nature 记者采访时表示,最荒谬的观点是,对于每个认识的人,都有单个的细胞专门用于识别那个人的那张脸。
其他理论则认为,多个神经元构成的集群一起工作,从而识别一张脸。
图片来源:Nature
研究发现人脸识别新理论,单个神经元对一组特征编码
加州理工大学的神经科学家 Tsao 和 Le Chang 研究了两只猕猴(Macaca mulatta)的大脑,确定动物大脑中脸细胞(face cell)的位置。他们将人脸或其他物体的图像,包括身体、水果和随机图案展示给这两只猕猴看。然后,使用功能核磁共振成像(fMRI)查看,当这两只猕猴看到“脸”时,哪些脑区会被激活(亮起)。
接下来,他们专注于研究被激活的点,也就是所谓的“脸细胞”。Tsao 和 Chang 使用了一组包含不同特征的 2000 张人脸给猴子观看,这些不同特征包括眼睛之间的距离、发际线的形状等等。
然后,他们将电极植入猕猴的大脑中,比较各个神经元对面部差异的反应。
Tsao 和 Chang 记录了两只猕猴间共计 205 个神经元的反应。每个神经元都会对一些面部参数的特定组合产生相应。
视觉皮层神经元针对特意设计的人脸不进行响应,证明了论文提出的 Axis Model 确实存在
西雅图华盛顿大学视觉神经生理学家格 Greg Horwitz 在接受 Nature 记者采访时表示,Tsao 和 Chang 两人的工作可以简单概括为开发了一个模型,让人能从计算机屏幕上的图像中看到,视觉皮层中神经元对脸部的反应。
Horwitz 说:“这是一个巨大的进步。”因为这个模型描绘了每个细胞是如何对所有可能的面部特征组合产生相应的,而不仅仅是一个。
推翻此前假说,大脑不是“人脸识别机”,而是“人脸分析仪”
不仅如此,Tsao 和 Chang 还考虑了,在进行脸部识别,也就是识别各种面部特征的特定组合时,每个神经元是否有“最擅长”的一个组合。
他们根据每个神经元对其特征的反应,尝试重现猕猴看见的面孔,从而验证了这一想法。基于这些信号的强度,神经科学家几乎可以完美地重现真实的面孔。
实验中,当猕猴看到不同的脸部图像,但这些不同是神经元“不关心”的组合时,单个脸细胞的反应保持不变。
打个比方,当猕猴看见两张发际线不同的照片,它们视觉皮层中关心眼睛大小的神经元不会产生变化。
换句话说,“神经元不是人脸检测器,而是面部分析仪,”Leopold 告诉 Nature 记者,大脑“能够意识到一些关键的维度(dimension),可以分辨出这是人 A,这是人 B”。
论文作者 Tsao 表示,人的大脑可能会使用这个代码来识别或想象具体的面孔。
视觉皮层神经元针对特意设计的人脸不进行响应,证明了论文提出的 Axis Model 确实存在。来源:Cell 论文
每个脸细胞的调谐(tuning)都是面部维度的组合,是一个整体的系统,这也说明了为什么当某人把胡子挂掉时,他的朋友可能一开始注意不到,《纽约时报》的报道指出。
根据论文,需要大约 50 个这样的维度来识别一张脸。
这些维度构建了一张精神上的“面孔”,可以识别无数张脸。
《纽约时报》报道还表示,可能存在一张平均脸(或类似的东西),新遇到的一张脸可能一个特征(比如眼睛距离)在一个维度上平均偏离平均脸 5 个单位,而另外一个特征(比如发际线)在这个维度上则是偏离 7 个单位。
一张人脸可以分解为多个维度,而每个脸神经元大约会编码其中 6 个维度的若干参数,整合在一起就形成了一张整体的脸。
Tsao 在接受《纽约时报》采访时表示,她印象特别深刻的是,可以设计出一整套面孔,各种特征组合,而给定的脸细胞都不会发生响应,因为这些设计出的面孔都不是细胞“擅长”识别的维度的组合。
这也排除了此前的一种人脸识别假说——脸细胞将输入的图像与一组标准的人脸数据进行比较,并从中寻找差异,而后者正是此前计算机识别人脸时常用的一种方式。
论文中提出的人脸识别模型的示意图。来源:Cell 论文
不过,科学家目前仍然不确定一切是如何联系在一起的。
但是,能够肯定一点,Leopold 在接受 Nature 采访时表示:“这项研究为大脑实际上如何去分析单个的人提供了一个更实际的替代方法。”
《纽约时报》报道称,机器学习给神经科学带来了一种悲观主义色彩,认为大脑类似黑箱,该论文则提供了反例:研究人员记录了视觉系统最高级的神经元信号,可以看到那里没有黑箱。
也就是说,揭开大脑的奥秘是完全可能的。
接下来,就是人工智能要做的事情了。
论文介绍:亮点及概要
亮点
面部图像可以使用大约 200 个脸细胞(face cell)的反应进行线性重建
脸细胞显示(display)与被编码的轴在正交平面上平直调谐(flat tuning)
轴模型比样本模型更有效、鲁棒和灵活
面部结构(patch)ML/MF 和 AM 携带有关脸的补充信息
概要
灵长类动物以惊人的速度和可靠性识别复杂的物体,比如动物的脸。本文中,我们揭示了大脑进行面部识别的代码。猕猴实验表明,在面部结构中,面部和细胞反应之间存在着非常简单的转变。通过将动物的脸格式化为高维线性空间中的点,我们发现每个脸细胞的发射速率(firing rate)与入射面部刺激在该空间单个轴上的投影成正比,这样一来,一个脸细胞就能对空间中任何位置的脸进行集合编码。使用这个代码,我们可以精确地解码面部神经元群的反应,并预测关于动物脸的神经发射速率。此外,这一代码推翻了此前由来已久的假设,那就是脸细胞会对特定的面部特征进行编码。我们的研究表明,其他对象也可以由类似的度量坐标系统进行编码。
编译来源
Nature 报道:http://www.nature.com/news/neuroscientists-rethink-how-the-brain-recognizes-faces-1.22091
Cell 论文:http://www.cell.com/cell/fulltext/S0092-8674(17)30538-X?_returnURL=http%3A%2F%2Flinkinghub.elsevier.com%2Fretrieve%2Fpii%2FS009286741730538X%3Fshowall%3Dtrue
NYT 报道:https://www.nytimes.com/2017/06/01/science/facial-recognition-brain-neurons.html
欢迎加入本站公开兴趣群
商业智能与数据分析群
兴趣范围包括各种让数据产生价值的办法,实际应用案例分享与讨论,分析工具,ETL工具,数据仓库,数据挖掘工具,报表系统等全方位知识
QQ群:81035754
以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网
猜你喜欢:本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
Java多线程编程实战指南(设计模式篇)
黄文海 / 电子工业出版社 / 2015-10 / 59.00
随着CPU 多核时代的到来,多线程编程在充分利用计算资源、提高软件服务质量方面扮演了越来越重要的角色。而 解决多线程编程中频繁出现的普遍问题可以借鉴设计模式所提供的现成解决方案。然而,多线程编程相关的设计模式书籍多采用C++作为描述语言,且书中所举的例子多与应用开发人员的实际工作相去甚远。《Java多线程编程实战指南(设计模式篇)》采用Java(JDK1.6)语言和UML 为描述语言,并结合作者多......一起来看看 《Java多线程编程实战指南(设计模式篇)》 这本书的介绍吧!