内容简介:昨天52CV君发现一篇奇文,《Face Detection at 15,000 FPS:Real-Time Inference on GPU and CPU》,速度高达15000fps的人脸检测算法!
我爱计算机视觉 标星,更快获取CVML新技术
昨天52CV君发现一篇奇文,《Face Detection at 15,000 FPS:Real-Time Inference on GPU and CPU》,速度高达15000fps的人脸检测算法!
我认为用real-time来形容它的速度已经不够贴切了,这明明是闪电嘛~
这篇论文来自SIBGRAPI2018,是一个位于巴西的关注计算机图形、视觉、模式识别、图像处理的学术会议,看起来巴西人不仅踢球快,检测算法也追求超级快。
主要思想
其主要思想概括一下,就是图像缩小后再CNN检测。请看下图:
该算法将图像缩到极小(最小达到16*16像素),然后进行CNN检测,CNN此时跑的非常快。这时候原图中的小尺寸人脸往往是检测不到的,不过没关系,对于一些特定场景(比如车载摄像头的人脸检测)已经够用了。
网络结构
下图展示了作者所用网络的结构:
上图最上面部分是网络流程,d1、d2、d3是网络结构,白色和灰色代表不同的inception结构。网络最后分别是分类(是否是人脸)和定位分支(位置在哪里)。图中不同颜色代表不同网络层或结构,最下面的部分有说明。
数据集
作者使用WIDER-FACE数据集的训练集制作训练集,按照含有人脸图像截取出来并进行一定的缩放。
Fig.3 展示了这一过程。
同时作者收集了GoPro拍摄的车内的视频作为测试集。
Fig.4 展示了其中示例。
实验结果
作者在实验阶段最重要的参数设置变化是图像大小,最大图像80*80,最小图像16*16。
对比的算法是经典的V&J人脸检测器。(估计也不好意思跟先进的算法比精度吧~)
不仅报告了精度,还报告了在CPU(I3-6006U)、树莓派3、1080Ti、1080Ti(batch size为256)上的运行fps。
请手机横屏查看下图列出的结果:
使用该文算法,在分辨率为64*64时取得了最高的精度,此时在树莓派3上也能达到实时(16.86fps)。
在分辨率16*16时取得了最快的速度,其中1080Ti(batch size为256)情况下高达15442.34fps!此时在树莓派3上也达到了49.61fps!
作者最后通过设置不同的分类阈值研究了IOU图,发现影响该算法检测精度的主要因素是定位不够精确,亦即很多时候分类器已经分类出人脸了,但定位不准。(这意味着如果能够提高定位精度,这个算法就更逆天了)
可惜的是,目前还未发现作者将此算法开源~
加入专业讨论群
加入52CV-人脸识别专业讨论群,扫码添加52CV君(your-word)拉你入群:
( 请务必注明:人脸 )
喜欢在QQ交流的童鞋,可以加52CV官方 QQ群 :928997753。
(不会时时在线,如果没能及时通过验证还请见谅)
本文对你有帮助吗?欢迎留言。
长按关注 我爱计算机视觉
【点赞与转发】 就是一种鼓励
以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网
猜你喜欢:- 算法升级!开源极快速CNN人脸检测新增人脸关键点功能
- 全球人脸识别算法测试最新结果:中国算法包揽前五
- 基于Adaboost算法的人脸检测分类器!
- 人脸识别三大经典算法(附经典论文列表)
- 清华&商汤开源超高精度边缘感知人脸对齐算法
- 人脸算法拼杀中,深醒科技的自我迭代
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
算法:C语言实现
塞奇威克 / 霍红卫 / 机械工业出版社 / 2009-10 / 79.00元
《算法:C语言实现(第1-4部分)基础知识、数据结构、排序及搜索(原书第3版)》细腻讲解计算机算法的C语言实现。全书分为四部分,共16章。包括基本算法分析原理,基本数据结构、抽象数据结构、递归和树等数据结构知识,选择排序、插入排序、冒泡排序、希尔排序、快速排序方法、归并和归并排序方法、优先队列与堆排序方法、基数排序方法以及特殊用途的排序方法,并比较了各种排序方法的性能特征,在进一步讲解符号表、树等......一起来看看 《算法:C语言实现》 这本书的介绍吧!
UNIX 时间戳转换
UNIX 时间戳转换
RGB HSV 转换
RGB HSV 互转工具