内容简介:「极客公开课·Live」5 分钟带你复习人脸识别技术的实际应用有哪些?
这是极客公园「极客公开课 · Live」第五期的活动,来自 Face++智能商业产品线总经理宋晨和我们分享了人工智能在日常生活中可实现的应用场景,如何将技术产品化、商业化,人脸识别的概念是什么?基于先进的人脸识别核心算法,Face++在智能商业领域中如何实现 AI+。
什么是「极客公开课」?
1 位技术产品大牛和 10 位优秀技术产品人围绕技术产品相关话题,面对面深度分享和讨论,共同创造更优的知识与更高的学习效率。
而现在,这种深度的交流方式属于每一个人,知乎 Live 同步线上实时问答,随时随地参与提问互动,与数百人共创一本知乎 live 版的「课堂笔记」
每周 1 次,全年 50 场,极客公开课,推动产品人的自我迭代
以下为本期课堂笔记精华摘要:
人工智能的闭环
人工智能这件事情谈得现在也很多,什么是人工智能每个人的理解不太一样,在我们看来所谓人工智能的定义,我们会把它定义为一种闭环,这里面的闭环是通过数据、技术、产品到最终的使用,使用完以后的反馈,这样形成一个整体的闭环,我们拿谷歌这个公司或是百度来举例子。
谷歌大家都知道,是搜索引擎嘛,那搜索引擎通过这个技术,首先创造了搜索框,也就是现在的产品,所有的用户都在使用,使用完以后你所有的搜索习惯、关键词和搜索的记录其实都会被记录下来,包括你的历史的习惯,这个时候反馈到后台以后会做分析,分析完以后再改进产品,所以你会发现在使用搜索框的时候,后面再去用的时候,搜索的内容和提示的内容会有些许的不太一样
在深度学习这部分,其实也使一样的,也是通过整个的神经网络和世界的深度学习的技术创造出不同的产品,这个产品会分不同的行业、不同的场景,紧接着就是用户去使用,使用完以后产生了数据,数据的回流会带动深度学习的引擎,比如说我们所谓的识别成功率,大家都关心的问题,刚开始可能是七八十分的水平,看慢慢的变成 80 分、90 分、100 分这么一步一步往上,所以是一个深度学习引擎闭环的过程。那么我们谈到在整个的公司分布上来讲,其实也能看到,在人工智能领域当中会分不同的类别,包括有机器学习的通用类别、应用和机器人的语音的助手,旷视会在机器视觉里面的通用的部分。
所以人工智能为什么 2015 年爆发,其实会受到很多的硬件和算法瓶颈的突破,像图象处理和深度学习,是基于 GPU 的训练来产生的,所以 2015 年之后图象处理的这些板卡过程是什么大家购买的很多,这也是为什么这个财报很好看的原因之一。
机器视觉
机器视觉我们会把它定义成给机器赋能,让它具备一双眼睛的能力,让它像人一样思考、去想、去看,它能够有这些功能以后,做的事情就会比较多了,包括有各种的检测、判断、识别、测量,其实就会做很多的事情。在我们研究的 机器视觉的方向上我们可以看到,从人脸开始到人,到文字、到车,最后到所有的感知器件,这是线下所有能够被机器识别的,这里面也是让大家知道,从不同的识别类型里面,其实是可以做分类的,包括图片分类、视频分类,是通过不同的分值来判断的。
什么是人脸识别
人脸这部分有两个非常核心的维度。
第一,1:1 定义是一个判断的作用,应用的场景其实是在金融和人证,特点是更加的精准和安全,所以现在大家不管是支付宝还是银行的人证比对、实名的业务,基本上都会用到 1 比 1 人脸的识别。
第二,1:N 更多的是在一个数据库当中或者是一个底库当中,能够找到这个人是不是在底库当中的人,所以是个识别的过程,是一个动态的,还是一个非配合的场景,比如说在安防当中我去缉拿逃犯,我去抓到逃犯总不能让逃犯看到摄象头。在商业场景当中也不可能让我们的 VIP 客户、员工、会员对着摄象头做着一遍操作,所以是动态和非配合的场景。
这里面 1:1 有个过程,通过身份证能够读取图片的介质,再加上现场的抓拍的照片,有两个源来做个比对,最后做个结果告诉你他是不是本人,更高级一点是通过一个公安部的数据库,做一个交叉比对,来证明我读的这张身份证里面的信息是不是真伪的。像这种比对,现在我们做到的是互联网金融,你们的贷款、消费做到实名验证,基本上互金的业务我们 80% 以上的市场都在用到 Face++提供的技术支持。
1:N 的部分也会分为三个阶段,大家最了解的可能是后面的人脸识别,前面的两个阶段还是很重要的。
1. 我要在一个动态的视频流当中找到人脸的位置。
2. 我找到人脸位置以后,还要知道这个人脸可能有侧脸、逆光和模糊的情况出现,所以还会有一个判断的过程,我这张脸每秒 25 帧里面哪一帧图片是适合去做人脸识别的,最终会抽取一张比较适合去做人脸识别的照片,最后再去做人脸识别真正的比对,所以是三个步骤。
3. 逆光的场景。详细讲解请见知乎 Live
人脸识别技术应用阶段
2016 年很多公司已经把这些关键技术已经形成了突破,另外一个比较好的方式是说,人脸识别的生物识别技术,其实是相对于用指纹、虹膜和其他的掌纹来的会更加便捷。第一是一个唯一的标识,第二不会说,比如说用指纹识别,有时候会有油腻,手指也比较脏,掌纹和虹膜的采集又是比较复杂的过程,所以从技术角度讲,我们认为它已经具备了商业化的能力。
我们从时间轴来看一下。其实任何一家人脸识别和人工智能的公司都会经历五个阶段:
第一阶段和第二阶段主要是在实验室阶段,这个阶段其实大家也比较了解,基本上会去刷榜,大家会看到我参加了一些第三方的公共的公开数据,我已经变成了世界第一,我超过了谷歌、Facebook,这是刷榜的环节,大家也知道其实是有很多的手段的。第二个阶段会到我能证明我学术的方式能够做到非常先进的水平,我想让所有人都会去用,这个时候会产生 SDK,给大家去装。
第三个阶段,由我们来输出一些单一的功能性产品或者是单一的功能性解决方案。
第四个阶段,会是一个解决方案的层级,在人脸识别或者是人工智能视觉的领域中会提供一个端到端的解决方案,由我们来替客户去想象我前端的硬件设备是什么样,后端的算法处理器是什么样,算法是跑在云端还是本地的,是智能化前移还是云计算处理的。
第五个阶段,就是一个综合平台,因为任何一项技术都不是完美的,而且也是单一的功能点,所以除了人脸识别之外,有可能还会结合不同的 API 的接口调用,有时候里面会涉及到指纹、门禁开关,所以会是一个综合性的平台。
详细讲解请见知乎 Live
如何选择 AI 的商业化
第一,盘子足够大,能够支撑公司的长远发展。
第二,数据回流。人工智能领域来讲,一家伟大的公司基本上会有几个前置条件,人工智能要用到深度学习这些技术,技术维度我们不谈了。二是因为你是持续训练和持续迭代的过程,所以场景当中数据回流为我所用的这个概念,一定是非常重要的,数据我这边可以举几个例子,比如说之前没太存在的一些公司,像外包和标注公司,,现在我们发现 2016 年、2015 年以后标注公司业务很火,因为我们是一家单独的人脸识别和人工智能公司,但是标注公司可以服务所有的厂家,跟英伟达一样,GPU 给百度也能给,给腾讯也能给,给阿里也能给,所以标注这部分数据回流以及数据的训练,其实是非常重要的。
第三,是否是高频的场景和高频的使用。
第四,是否可复制,在整个行业当中我不可能按照项目的方式,在行业当中我不可能按照项目的方式,做一个项目一个项目这么去做,一定是说做了一个项目或者是几个项目之后,在整个的行业当中到底能不能复制,能不能 1+X 的这种方式。详细讲解请见知乎 Live
垂直行业人脸解决方案
这里面也可以给大家看一下我们选择性的安排和战略选择,这里面我们有三个行业。金融、安防和地产。我们把刚才所说的四个维度放在这儿,我们可以一个一个去看。
首先金融的这个市场规模不用说了,一定是很大的,安防、地产都是一样的,都是非常大的市场规模。在数据回流上来讲,金融和地产是一个非常天然性的回流,比如说金融、互联网金融,大家用的都是手机上的数据,数据已经在互联网上了,地产会分为商业地产、住宅地产和零售,所以这些所有都是通过云的方式、数据回流做训练的。
安防来讲确实是比较难,因为毕竟是专网和公安打交道,但是有很多的手段可以把数据训练出来,包括有一些脱敏的技术和混合云的技术是可以做到的。
第三就是高频使用,可以看到这三个场景基本上都是高频使用的场景,比如说现在比较火的 P2P 金融,我相信每周、每天或者是每个月使用几次或者是十几次是很正常的一件事情,安防也不说了,现在外面布的所有的摄象头和做的智慧城市,所有的视频都会用到。地产我们做的人员通行的管理、零售场景其实都是一个高频使用的场景。详细讲解请见知乎 Live
如何实现 AI+地产行业
我们就拿一个行业来说,我们把地产的这个行业拿出来,我们会分为商业地产和住宅地产两项,可以看到有办公楼、园区、商业零售、酒店,住宅里面会分为小区和公寓。我们会在网上搜寻到一些数字,可以看到 2015 年到 2019 年,整个楼宇智能化的市场规模增长非常大的,在楼宇智能化里面也会涉及到很多,包括消防、安全,这里面我们跟人工智能和视觉相关的大概有这么几个维度,视频监控、门禁控制、楼宇对讲、防盗报警、可视化系统。这些东西都是和人脸识别息息相关的,这部分摘出来市场规模,我们回到刚才看到的一个维度,市场规模和盘子其实是足够大的。
我们也看到在每个领域当中现在都在寻求变化,比如说视频监控是一个智能化的改造,大家也可以去看看海康、大华,大家现在是怎么做的,门禁控制,现在像人脸识别的闸机已经非常普及了,后面可以给大家看一下我们具体的案例。楼宇对讲也使一样的,现在楼宇对讲语音的,后面会不会加上可视化的,防盗报警现在主要是降本增效,能不能以前是配 10 个保安,现在配 6 个或者是 4 个,能够解决一些降本增效的目的
可视化系统主要说对于管理者来讲会降低很多技术的门槛,比如说我们去给物业或者是领导或者是整个集团公司看的时候,其实可视化系统对于他的管理帮助是非常大的。
这里面主要是四个问题现在会比较严重。
1. 管理难度很大。
2. 数据价值。现在大家都在谈大数据,每个系统都有数据,数据价值到底有没有体现出来,现在基本上是割裂之的,也就意味着数据是大打折扣的。
3. 人工的成本是非常高的。
4. 没有可视化的呈现,所以导致很多人不明白或者是看不懂。详细讲解请见知乎 Live
以上就是本次公开课的所有关键内容。
本次课程完整笔记与 PPT,请点击「极客公开课·Live」第五期或扫描下方二维码查看获取:
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网
猜你喜欢:本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
CSS实战手册(第2版)
[美] David Sawyer McFarland / 俞黎敏 / 电子工业出版社 / 2010-6 / 69.80元
本书从介绍最基本的CSS知识开始,到建立用于打印网页的CSS和改进你的CSS习惯的最佳实践。将关于CSS的选择器、继承、层叠、格式化、边距、填充、边框、图片、网站导航、表格、表单、浮动布局、定位网页上的元素,以及用于打印网页的CSS等技术通过逐步地讲解与教程串联了起来。每章内容从简单到复杂,一步一步地建立起一个完整的教程示例,并在每章都会详细讨论一些技巧、最佳实践和各浏览器之间一致性的兼容问题及如......一起来看看 《CSS实战手册(第2版)》 这本书的介绍吧!