小白懵懂人工智能 (1):浅谈人脸识别这点事

栏目: 编程工具 · 发布时间: 8年前

内容简介:小白懵懂人工智能 (1):浅谈人脸识别这点事

现在混在职场,如果不懂一点人工智能的知识都不敢说你跟上了时代。况且你还是一名产品经理,技能之一就是八面玲珑又要有求知的欲望,不断地学习和吸收新的知识。谁能通俗的做个专业知识科普?又站在PM新人的角度思考和聊聊呢?   

小白懵懂人工智能 (1):浅谈人脸识别这点事

此文的目的?读后能得到什么?

  1. 此文献给不是AI产品经理但是想了解一些人工智能知识的同学,想学专业方法论的请绕行。
  2. 让你在茶余饭后闲谈时,参加大咖的AI交流沙龙时,面试Ai公司准备资料时,更熟悉和从容。
  3. 我希望用小白最能懂的话解释一些我们不懂的知识,因为我和你都是AI领域的修行者。

文章分为6个部分:

  1. 人工智能浅谈
  2. 人脸识别是什么
  3. 人脸识别的产品实现路径
  4. 国内外比较出名的公司
  5. 人脸识别核心技术
  6. 人脸识别的应用分类和案例

一、人工智能浅谈

人工智能今年被提的次数太多了,互联网的几个大风口有金融,AI,医疗,教育。

AI进入了很多的领域并让大家熟识,从自动驾驶汽车,到智能客服机器人,再到智能家居。 你似乎可以让任何商品(例如医疗健康药柜,智能音箱,无人车等),通过人工智能的技术使其更加智能和有趣。

目前各类文章经常提到人工智能的三个分类,有技术角度的,也有产品角度的。

在我理解,人工智能这类产品是技术驱动的产品,在百度,腾讯这样的公司都有AI部门,很多PM每天都要面对大量的技术文档和一些偏技术术语的资料,和传统的pm的知识结构差异很大。所以目前很多AI的产品经理的职责和工作内容还都很模糊和不确定。每个想干和已经在干的AI公司都在各种摸索中。

每1个分类,我都整理了一句话,我觉得是比较易懂和有价值的金句。

技术角度的三个分类

在很多学术文章里面和进入到AI工作领域后,总会大量提到这些汉字和单词。初学期慢慢来懂这些词和事,我们先混个眼熟。大家记住技术储备和技术人才在AI领域的地位。

  1. 认知AI (cognitive AI): 认知计算是最受欢迎的一个人工智能分支,负责所有感觉“像人一样”的交互。认知AI必须能够轻松处理复杂性和二义性,同时还持续不断地在数据挖掘、NLP(自然语言处理)和智能自动化的经验中学习。
  2. 机器学习AI (Machine Learning AI): 机器学习是要在大数据中寻找一些“模式”,然后在没有过多的人为解释的情况下,用这些模式来预测结果。
  3. 深度学习(Deep Learning): 深度学习是许多现代语音和图像识别方法的基础,并且与以往提供的非学习方法相比,随着时间的推移具有更高的准确度。

产品角度的三个分类

人工智能的产品路径也可分为三步或三类:

  1. 识别
  2. 判断决策
  3. 创造生成

图像识别,语音识别,人脸识别都属于识别部分。人脸比对,活体判断属于判断决策阶段,最高阶的是生成和创造阶段,比如图像语音合成,古诗词自动作文。

在目前的发展阶段,降峰pm觉得判断和决策类的产品更有产品和商业价值。不但是识别还有结果判断输出,可以提高很多事情的效率。

人工智能的产品分为图像,语音,自然语言,文字,用户画像等等很多方向。

一个AI平台的架构图

小白懵懂人工智能 (1):浅谈人脸识别这点事

你会发现里面的模块很多。子业务线也很多。

今天我先整理一个子集,图像领域的人脸识别方向。后续还有续集。

二、人脸识别是什么

在《速度与激情7》中就出现一个名为“天眼”的智能系统,可随时调用遍布城市的摄像机进行追踪,通过面部特征迅速准确定位,发动全城围捕。而《谍影重重》《国家公敌》等众多电影中,都出现过用人脸识别技术进行快速身份鉴别等桥段。炫酷高科技经常能把观众迷得不要不要的。

传统的人脸识别技术主要是基于可见光图像的人脸识别,已有30多年的研发历史。但这种方式在环境光照发生变化时,识别效果会急剧下降。解决光照问题的方案有三维图像人脸识别和热成像人脸识别,但这两种技术还远不成熟,识别效果不尽人意。另外,基于主动近红外图像的多光源人脸识别技术迅速崛起,它可以克服光线变化的影响,在精度、稳定性、速度方面的表现不俗。

如今,人脸识别在日常生活中的应用场景已非常宽泛。很多在安防和犯罪追捕方面有很多的案例。

例如:日本政府将人脸识别投入到2020年东京夏季奥运会的安全安保系统。

小白懵懂人工智能 (1):浅谈人脸识别这点事

一句话总结:人脸识别,是基于人的脸部特征信息进行身份识别的一种生物验证技术。

三、人脸识别的产品实现路径

1、人脸检测 ,找到脸

人脸检测与分析技术,是人脸识别的第一步。是指对于任意一副给定的图像,采用一定的策略对其进行搜索以确定其中是否含有人。

2、人脸对齐,找到五官位置

主要的目的就是在人脸区域进行特征点的定位,在人脸表情有变化,头部有姿势变化时仍能够精确定位人脸的主要位置,例如:嘴巴,鼻子,眼睛等位置。

3、人脸校准和相似度度量,做判断和决策

主要是1:1和1:N的识别问题,确认两张人脸是不是一个人和海量图片库识别相似脸等问题。

简单说人脸识别的基础就是先从一张图中识别出人脸位置,逐步把人脸上的特征点定位到,然后再做人脸校验和人脸识别等事。

下图这个案例就是一个人脸识别的效果:

小白懵懂人工智能 (1):浅谈人脸识别这点事

检测图中的人脸,并为人脸标记出边框。检测出人脸后,可对人脸进行分析,获得眼、口、鼻轮廓等72个关键点定位准确识别多种人脸属性,如性别,年龄,表情等信息。

后面再给大家举一些案例展开。

四、国内外比较出名的公司

1、国内知名公司

目前国内的公司发展的很快,大家感兴趣可以搜索如下一些网站获取更多信息和免费体验的资格。

每个公司的介绍就不一一写了。人工智能这林子太大了,想把鸟都抓齐不现实。不分排名前后,欢迎补充。

(1)腾讯优图

(2)百度AI 天智平台

天智是基于世界领先的百度大脑打造的人工智能平台,提供了语音技术、文字识别、人脸识别、深度学习和自然语言NLP等一系列人工智能产品及解决方案,帮助各行各业的客户打造智能化业务系统。

(3)旷视科技FACE++

美图秀秀这款神器,一直搭载了旷视科技的人脸识别技术:人脸关键点监测、大规模人脸监测等。

(4)汉王人脸识别

(5)云从科技 cloudwalk

(6)商汤科技SenseTime

(7)DeepGlint-格灵深瞳

(8)Linkface

(9)飞搜(FaceAll)科技

(10)科大讯飞

2、国外知名公司

除了国内这几家人脸识别公司之外,国外也有很多优秀的公司,比如:

  • 美国Identix公司
  • 美国Bioscrypt公司
  • 德国Cognitec Systems公司
  • 西班牙Herta Secunty公司
  • 日本NEC公司
  • 日本Softwise公司

五、人脸识别核心技术

核心技术有6类,在某个角度看,也是识别的路径步骤。

大家了解一下这些名词:

  1. 人脸检测跟踪
  2. 五官关键点检测
  3. 人脸像素解析
  4. 表情,肤色,种族,性别等元素识别
  5. 活体检测和识别验证
  6. 负责大量级的人脸检测及检索

大家还记得第三章的示意图片么?里面就包含了前4个部分的结论。

降峰老师重点谈下活体检测。目前金融行业都在用活体检测来进行风控识别能力的建设。我们在借款,付款时,会遇到让你拍摄正面照图片,再眨眨眼睛 摇摇头这些动作,就是在进行活体检测,证明你就是你,你是活的而不是图片。防止欺诈。这个有机会单独给大家将金融风控时单独谈。有很多检验的元素点和比对内容。

六、人脸识别的应用分类和案例

目前应用的场景比较多。我们简单列举几类:

  1. 人证比对
  2. 人脸验证
  3. 人脸识别查找
  4. 人脸美化

一些场景

如果再设想一些场景,会有如下一些场景,很多都已经实现了:

  1. 上班打卡 刷脸考勤,不用带工卡,智能门禁
  2. 入驻酒店景区,识别身份,给予VIp待遇。案例:乌镇闸机
  3. 启动汽车,无钥匙进入
  4. 刷脸支付,不用带卡带手机,直接扣款支付。案例:百度钱包
  5. 多图对比寻找唯一个体,比如100张王珞丹和100张白百合放在一起,找不同。

更多补充中。

如今2017年,人脸识别的识别率已经很高了。这个技术怎么商业化、怎么玩将会被进一步挖掘。暗流涌动的割据战现在正在拉开,安防、社交、金融的市场份额将鹿死谁手?我认为场景很丰富,玩法很多。

作者:降峰,十年产品人。百度金融资深产品经理,原海南航空产品总监,目前从事互联网金融方向产品设计和产品架构工作。微信公众账号:风之学堂

本文由 @降峰 原创发布于人人都是产品经理。未经许可,禁止转载。


以上所述就是小编给大家介绍的《小白懵懂人工智能 (1):浅谈人脸识别这点事》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

Paradigms of Artificial Intelligence Programming

Paradigms of Artificial Intelligence Programming

Peter Norvig / Morgan Kaufmann / 1991-10-01 / USD 77.95

Paradigms of AI Programming is the first text to teach advanced Common Lisp techniques in the context of building major AI systems. By reconstructing authentic, complex AI programs using state-of-the-......一起来看看 《Paradigms of Artificial Intelligence Programming》 这本书的介绍吧!

Base64 编码/解码
Base64 编码/解码

Base64 编码/解码

XML 在线格式化
XML 在线格式化

在线 XML 格式化压缩工具

html转js在线工具
html转js在线工具

html转js在线工具