内容简介:(欢迎关注“我爱计算机视觉”公众号,一个有价值有深度的公众号~)人群计数是通过计算机视觉计算人群数量,在公共安全和城市规划中有非常重要的应用。本文通过改进网络的尺度不变性,显著提高了人群计数算法性能。
(欢迎关注“我爱计算机视觉”公众号,一个有价值有深度的公众号~)
人群计数是通过计算机视觉计算人群数量,在公共安全和城市规划中有非常重要的应用。本文通过改进网络的尺度不变性,显著提高了人群计数算法性能。
该文来自昨天Arxiv新上论文《Stacked Pooling: Improving Crowd Counting by Boosting Scale Invariance》,作者信息:
在计算机视觉中尺度不变是经常被涉及的话题,与其相关最著名的算法就是SIFT(尺度不变特征变换)了。本文作者通过观察发现,在人群计数这一领域,图像不同区域通过resize到相同大小,在尺度上具有高度的视觉相似性。请看下面这幅图:
来自同一幅图像和不同的图像经过resize,子图内的人物大小、人群密度、层叠关系视觉上很相似。
由于神经网络中池化层直接关系到网络的尺度变化,所以本文作者希望改进池化层,提高人群计数的算法性能。
作者在vanilla pooling基础上发明了两种池化层变种,multi-kernel pooling 和 stacked pooling。
multi-kernel pooling图示:
stacked pooling图示:
为验证所提的池化层的有效性,作者们使用VGG-13网络的各种变形来进行人群计数。网络的变化包括卷积核大小,网络宽度、深度等,如下图所示:
作者在ShanghaiTech-A数据集上验证multi-kernel pooling在高密度组比vanilla pooling要好,而在整个ShanghaiTech-B数据集上multi-kernel pooling都是更好的。
使用stacked pooling方法的各种网络变种都在ShanghaiTech数据集上比vanilla pooling好,且具有明显的性能提升。
在WorldExpo’10数据集上大部分场景也取得了更好的效果。
代码主页:
https://github.com/siyuhuang/crowdcount-stackpool
点击阅读原文可以在www.52cv.net查看本文。
更多精彩推荐:
NVIDIA ECCV18论文:超像素采样网络助力语义分割与光流估计(代码将开源)
OpenCV深度学习文本检测示例程序(EAST text detector)
MaskFusion:惊艳的结合实例感知、语义分割、动态追踪的SLAM系统
(欢迎关注“我爱计算机视觉”公众号,一个有价值有深度的公众号~)
【本文由“我爱计算机视觉”发布,2018年08月24日】
以上所述就是小编给大家介绍的《尺度不变提升人群计数性能》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!
猜你喜欢:- 尺度不变网络提升人群计数性能
- 什幺是多尺度密集网络 – MSDNet ?
- 鱼和熊掌如何兼得?基于强化学习的多尺度信息传播预测
- 悉尼大学提出基于多尺度透射率估计去雾算法,消除照片上的雾霭烟霾
- 从宇宙大尺度结构到胎心监测,从手机消息推送到物联网大数据处理:跨界是创新的主要源泉
- 神经网络目标计数概述:通过Faster R-CNN实现当前最佳的目标计数
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
The Web Designer's Idea Book
Patrick Mcneil / How / 2008-10-6 / USD 25.00
The Web Designer's Idea Book includes more than 700 websites arranged thematically, so you can find inspiration for layout, color, style and more. Author Patrick McNeil has cataloged more than 5,000 s......一起来看看 《The Web Designer's Idea Book》 这本书的介绍吧!