爆料!传阿里人靠脸吃饭,真相是......

栏目: 编程工具 · 发布时间: 5年前

内容简介:从进出办公大楼到会议室,从取快递到食堂吃饭,只需对准摄像头刷一下脸,就能轻松完成通行、支付、取件等操作。在阿里巴巴,“脸”已经成为员工日常生活办公的通行证。

爆料!传阿里人靠脸吃饭,真相是......

从进出办公大楼到会议室,从取快递到食堂吃饭,只需对准摄像头刷一下脸,就能轻松完成通行、支付、取件等操作。在阿里巴巴,“脸”已经成为员工日常生活办公的通行证。

爆料!传阿里人靠脸吃饭,真相是......

阿里园区食堂使用人脸支付

作为园区“刷脸”的主要技术支持方,阿里巴巴信息平台事业部园区大脑技术团队负责人杨含飞(花名:少昊)表示,今年1月初,第一台人脸闸机才正式在园区落地。而现在,“人脸”已经运用在阿里园区的方方面面,平均每天会进行20多万次的人脸识别。

此外,随着会议活动对安防要求的增加,一些大型展会对人脸识别的需求也变得越来越强烈。在今年9月云栖大会上,阿里内部的这套人脸闸机,支持现场12万人次的通行。

爆料!传阿里人靠脸吃饭,真相是......

云栖大会上的人脸门禁

那么,在这些大规模的人员识别场景中,阿里内部的人脸识别究竟是如何做保障的?

今天,我们邀请少昊亲自揭秘阿里巴巴人脸识别的优化方案。

人脸识别时,首先需要对方提供一张照片进行人脸注册,然后在识别过程中,通过终端照片去检测当前画面照片上是否有人脸出现。如果有就会去提取特征并与服务端算法进行对比,来确认两者之间是否一致。可见,人脸识别实际上是特征的“提取”与“对比”。

少昊认为,在这一过程中,特征提取是否完整与充分,对比是否快速准确,与识别算法、终端软硬件以及人脸底库照片都有关系。所以,信息平台在做大型人员识别的优化时,主要从这三个方向入手:

终端的优化

终端的优化分为硬件与软件。硬件上,主要针对摄像头采用宽动态技术,IPS优化,从捕捉画面前景与背景处理上达到清晰均衡的要求,解决逆光问题,让人脸识别更加快速有效。

爆料!传阿里人靠脸吃饭,真相是......

软件上,我们主要对拍摄清晰度做管理和控制。一般来说,在捕捉到识别图像后,首先会对每帧图像进行数据监控与评估。在经过数据化打标之后,会给图像进行分类,来考察不同清晰度下的图像通过率。以及不同清晰度与角度下,图像的实际分布情况。这能有效管控识别速度与识别距离,确保整个识别过程的通行效率。

识别算法的优化

误识率是人脸识别的基础,所以在识别算法上,技术人员一是对误识进行控制;二是对相似度进行管理。

因为受算法性能影响,随着人脸底库的增加,算法性能会逐步降低。如何在识别服务上进行优化,成为人脸识别的一大关键。

用户行为产生的大量数据,使数据预测成为可能。比如在杭州进行人脸识别出现误识别,本人有可能实际上正在北京出差或休假等。所以,如果结合数据算法模型来准确的预测用户行为,对人群进行合理区分的话,就能一定程度解决误识别。

基于此,团队成员在误识别上进行的第一个优化就是——分组优化。通过特征细分人群,降低误识,提高通过率。

分组优化首先需要考虑时间与空间因素。如果把一个区域空间圈得越小,未来一定时间内出现在该特定区域内的人也会越少。同时,时效越强,在该区域该时段出现的人脸也会越少。

同时,结合实际应用场景,通过业务规则与特点的判断,以及人脸识别算法的性能特性,就能更好确认合理的空间、时间以及人数的分组规模情况。

以阿里巴巴园区人脸识别取件的分组优化为例。从地域属性上来看,每个小邮局都是一个固定的空间单元,有具体的位置。从时效性来看,当包裹到达小邮局后,它的主人在一段时间内会去拿包裹。从业务属性上来看,小邮局是收取包裹快递的地方。通过这三点属性,就能基本确定取件场景的分组优化方案。判断哪些员工会去哪个小邮局的分组中。

此外,取件还会存在代领情况。这一情况在业务规则中就没法确认,需要基于历史行为去分析,一个包裹被别人代领的可能性是多少,以及被谁代领的可能性更高。然后将这一预判结果加入到人脸识别的分组中。

爆料!传阿里人靠脸吃饭,真相是......

阿里园区小邮局通过人脸取件

通过一系列的算法模型学习优化,提升模型预测的准确性,不断的改善人员分组质量,目前人脸在支持阿里巴巴园区通行上,误识率已经有效控制在千分之一左右。

除了分组优化外,在面对不同肤色与人种的情况下,团队还建立了不同种类的算法模型与底库。这样可以针对特定肤色人种的通行率和误识率,做针对性的优化。

人员底库照片的优化

少昊表示,很多时候,人脸识别不成功并不是现场摄像头或比对算法出了问题,还是底库照片的质量太差,导致无法进行人脸识别。除了让对方重新提供照片图像外,还可以通过算法进行大小脸检测、照片校正以及身份核实,来确认本人身份。

此外,算法还可以帮助底库照片进行自学习。通过人员照片序列的分析后,提取特征进行图片聚类分析,随后再通过图片质量分析后,对本人身份进行核实,进而完成底库照片的注册与特征提取。

通过上述手段优化,在人脸识别通过率保持不变的情况下,误识率可以降到1‰。

今年双11期间,阿里园区的这套人脸识别技术还应用于双11作战指挥室与天猫双11晚会现场的安防保障。

少昊表示,通过人脸属性识别的进一步丰富,硬件及算法能力的进一步提升,未来,人脸识别技术将会满足更多商业场景需求,一个真正的刷脸时代就要来了。

【本文为51CTO专栏作者“阿里巴巴官方技术”原创稿件,转载请联系原作者】

戳这里,看该作者更多好文


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

编译原理

编译原理

Alfred V. Aho、Monica S.Lam、Ravi Sethi、Jeffrey D. Ullman / 赵建华、郑滔、戴新宇 / 机械工业出版社 / 2008年12月 / 89.00元

本书全面、深入地探讨了编译器设计方面的重要主题,包括词法分析、语法分析、语法制导定义和语法制导翻译、运行时刻环境、目标代码生成、代码优化技术、并行性检测以及过程间分析技术,并在相关章节中给出大量的实例。与上一版相比,本书进行了全面的修订,涵盖了编译器开发方面的最新进展。每章中都提供了大量的系统及参考文献。 本书是编译原理课程方面的经典教材,内容丰富,适合作为高等院校计算机及相关专业本科生及研......一起来看看 《编译原理》 这本书的介绍吧!

CSS 压缩/解压工具
CSS 压缩/解压工具

在线压缩/解压 CSS 代码

Base64 编码/解码
Base64 编码/解码

Base64 编码/解码

UNIX 时间戳转换
UNIX 时间戳转换

UNIX 时间戳转换