内容简介:本文作者根据多年人脸识别项目经验,总结了人脸识别技术在安防、商业领域应用及产品设计细节,汇总成应用层下的人脸识别系列文章。本文为系列文章的第二篇,介绍人脸库的相关内容。人脸库是人脸识别的基础,建立人脸库往往是人脸项目的首要任务,全文围绕着什么是人脸库及如何建立人脸库展开讨论。
本文作者根据多年人脸识别项目经验,总结了人脸识别技术在安防、商业领域应用及产品设计细节,汇总成应用层下的人脸识别系列文章。
本文为系列文章的第二篇,介绍人脸库的相关内容。人脸库是人脸识别的基础,建立人脸库往往是人脸项目的首要任务,全文围绕着什么是人脸库及如何建立人脸库展开讨论。
1. 什么是人脸库
简单来讲,人脸库就是 人脸数据的储存管理中心 ,能够为人脸识别提供比对模板,为抓拍人脸数据提供管理空间,为人脸算法检测提供测试样本。人脸识别项目是建立在人脸库的基础之上,所以人脸识别的首要任务便是是建立人脸库。
人脸库按照用途可分为 人脸比对库 、 人脸抓拍库 、 人脸数据集 ,不同类型人脸库的组成、结构、作用也有所不同,下面将会依次介绍,本文重点讨论人脸比对库。
1.1 人脸比对库
人脸比对库主要用于人脸1:N识别,如下图,人脸1:N是将 人脸抓拍照片的人脸特征与人脸库中所有人脸特征进行逐一比对 。
人脸比对库主要由 人脸库管理 、 人脸数据 、 人脸库属性描述 三部分组成,如下图:
人脸比对库按照应用场景又可分为四类,分别是 黑名单库 、 白名单库 、 红名单库 和 灰名单库 。
(1)黑名单库:黑名单指需要重点管控、关注的人员,一般由在逃犯、惯犯、水客、异常行为或是想要重点关注的人员构成。比中黑名单中会产生报警提示,常用于公安追逃;
(2)白名单库:白名单一般指可信人员,常用于商业领域中的通行管理,白名单中的人员容许进入通过。例如在楼宇内设置人脸识别门禁,只容许公司内部人员进入,于是可将公司员工设置成白名单,白名单一般不会触发报警;
(3)红名单库:红名属于白名单的拓展应用 ,用于白名单中需要重点关注展现的人群,如VIP客户、领导人等, 可在识别后进一步分析该人群的行为特点和活动范围;
(4)灰名单:介于白名单和黑名单之间,是一类具有异常行为的可疑人员,还需要通过更多数据分析他们是否是黄牛、小偷、罪犯同伙等。
1.2 人脸抓拍库
人脸抓拍库是管理人脸抓拍数据的地方,在视频流或图片流中凡是能被算法检测到的人脸都会经过图像处理形成一张张人脸的抓拍照片及对应的场景照,再将抓拍照片进行数据结构化并与其场景照一同保留至人脸抓拍库中。
抓拍库的人脸照片会具有性别、年龄、戴眼镜、胡须、表情、是否戴帽子、是否有遮挡等图片描述,方便抓拍照片的检索及深层次人脸数据应用。
人脸数据分为 结构化数据 和 非结构化数据 ,人脸结构化数据指将原始采集数据按照规则处理,形成具有统一格式,并用数据库二维逻辑表来表现的数据。
如下图:抓拍库储存的是结构化数据,人脸结构化数据指原始人脸数据经过程序分析和过滤,形成具有统一格式和描述的数据储存在数据库中。
1.3 人脸数据集
人脸数据集就是用于检测人脸算法效果和训练算法的数据库,网上有很多公开的人脸数据集可为模型训练提供数据来源。
常见的人脸数据集可见下表:
人脸识别
人脸检测
人脸表情
人脸年龄、性别
2. 如何建立人脸库
人脸库中人脸比对库的建立最为为复杂,这里只讨论人脸比对库的建立过程。
2.1 梳理入库流程
人脸入库流程见下图,人脸数据包含 人脸特征向量 , 人脸信息 两部分,它们储存在数据库不同的表中,注意在删除人脸库照片时一定要删除它对应的特征向量。如果照片质量未达到要求,且没有更好的照片,可以有强制入库的选项。
2.2 制定入库规则
人脸数据的质量关系到人脸比对的效果,尽可能将 人脸清晰、正脸、本人近期 的人脸照片入库。在人脸入库时,产品经理需要制定入库规则来过滤质量不佳、格式不规范的人脸数据。
入库规则应该包含:
- 图片的颜色:可支持彩色及灰度的图片,最低要求256灰度图片;
- 图片的格式:各类主流图片格式,例如 bmp/jpg/png等,图片命名格式统一,如常用的命名“姓名_证件号”;
- 图片像素:双眼中心之间的距离大于30像素;
- 图片尺寸:尺寸大于70X80以上;
- 人脸角度:人脸左右偏转30度以内,上下偏转20度以内;
- 入库图片大小建议几十KB~几百KB之间为宜,但也不能太大,超过1M,会影响入库和识别的速度。
2.3 设计人脸库功能、及界面
人脸库应包含人脸信息的增、删、改、查等基本功能,人脸库界面可参见下图的样式:
人脸信息可以从客户端批量导入,客户端需要提供人脸批量导入模板,批量导入适合小规模格式统一的数据。
当人脸项目中需要入库数万以上的人脸信息,并且人脸数据格式并不统一,整理起来很麻烦,这时就需要设计批量入库工具。
新建的人脸库需要设定人脸规模,一般分为 <1W 、 1W-100W 、 100W-1000W 、 >1000W 四个范围,大库容进行人脸比对需要更高配置服务器,服务器配置与图像处理能力的关系将会在后续文章中详细讨论。
2.4 采集人脸库数据
如果想通过人脸识别技术识别某人,就需要先获取到该人的人脸数据,并录入人脸库中作为比对模板,那么如何采集人脸库数据呢?采集方式依据使用场景而定。
公安类项目,人脸数据提供方是公安,公安内部有大量的人脸数据,可通过对接公安信息资源库来获取人脸数据,如下图为八大公安信息资源库。
公安的信息资源库是严禁外泄的,对产品的网络安全及数据保密性要求颇为严格,在产品设计时需要考虑到相关问题。
刷脸通行或新零售类项目,一般是用户配合式采集人脸信息,需要设计人脸信息采集入口,用户可在微信公众号、手机app或PC端进行注册时上传人脸信息。
大型商业类或平安城市项目中,需要设计非配合式采集人脸信息。一般会通过在主要出入口、通道、走廊等地部署的人脸抓拍机,抓拍路人人脸,自动建立该人档案库,这里需要用到一人一档,作者会在后期文章详细讨论。
以上就是系列文章的第二篇-人脸库的相关内容,后续将会推出人脸识别系列文章,欢迎大家与我交流图像识别相关问题。
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网
猜你喜欢:本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
Building Web Reputation Systems
Randy Farmer、Bryce Glass / Yahoo Press / 2010 / GBP 31.99
What do Amazon's product reviews, eBay's feedback score system, Slashdot's Karma System, and Xbox Live's Achievements have in common? They're all examples of successful reputation systems that enable ......一起来看看 《Building Web Reputation Systems》 这本书的介绍吧!