内容简介:(欢迎关注“我爱计算机视觉”公众号,一个有价值有深度的公众号~)人群计数是通过计算机视觉计算人群数量,在公共安全和城市规划中有非常重要的应用。今天分享的文章通过改进网络对该任务的尺度不变性,显著提高了人群计数算法性能。
(欢迎关注“我爱计算机视觉”公众号,一个有价值有深度的公众号~)
人群计数是通过计算机视觉计算人群数量,在公共安全和城市规划中有非常重要的应用。今天分享的文章通过改进网络对该任务的尺度不变性,显著提高了人群计数算法性能。
文章来自几天前arXiv新上论文《Stacked Pooling: Improving Crowd Counting by Boosting Scale Invariance》,作者信息:
在计算机视觉中尺度不变是经常被讨论的话题,与其相关最著名的算法就是大名鼎鼎的SIFT(尺度不变特征变换)了。该论文作者通过观察发现,在人群计数这一领域,图像不同区域通过resize到相同大小,在尺度上具有高度的视觉相似性。请看下面这幅图:
来自同一幅图像和不同的图像经过resize,子图内的人物大小、人群密度、层叠关系视觉上很相似。
由于神经网络中池化层直接关系到网络的尺度变化,所以本文作者希望改进池化层,提高人群计数的算法性能。
作者在vanilla pooling基础上发明了两种池化层变种,multi-kernel pooling 和 stacked pooling。
multi-kernel pooling图示:
stacked pooling图示:
为验证所提的池化层的有效性,作者们使用VGG-13网络的各种变形来进行人群计数。网络的变化包括卷积核大小,网络宽度、深度等,如下图所示:
作者在ShanghaiTech-A数据集上验证multi-kernel pooling在高密度组比vanilla pooling要好,而在整个ShanghaiTech-B数据集上multi-kernel pooling都是更好的。
使用stacked pooling方法的各种网络变种都在ShanghaiTech数据集上比vanilla pooling好,且具有明显的性能提升。
在WorldExpo’10数据集上大部分场景也取得了更好的效果。
代码主页:
https://github.com/siyuhuang/crowdcount-stackpool
更多精彩推荐:
NVIDIA ECCV18论文:超像素采样网络助力语义分割与光流估计(代码将开源)
OpenCV深度学习文本检测示例程序(EAST text detector)
MaskFusion:惊艳的结合实例感知、语义分割、动态追踪的SLAM系统
(欢迎关注“我爱计算机视觉”公众号,一个有价值有深度的公众号~)
以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网
猜你喜欢:- 尺度不变提升人群计数性能
- 什幺是多尺度密集网络 – MSDNet ?
- 鱼和熊掌如何兼得?基于强化学习的多尺度信息传播预测
- 悉尼大学提出基于多尺度透射率估计去雾算法,消除照片上的雾霭烟霾
- 从宇宙大尺度结构到胎心监测,从手机消息推送到物联网大数据处理:跨界是创新的主要源泉
- 神经网络目标计数概述:通过Faster R-CNN实现当前最佳的目标计数
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
Web Design Handbook
Baeck, Philippe de 编 / 2009-12 / $ 22.54
This non-technical book brings together contemporary web design's latest and most original creative examples in the areas of services, media, blogs, contacts, links and jobs. It also traces the latest......一起来看看 《Web Design Handbook》 这本书的介绍吧!