内容简介:(欢迎关注“我爱计算机视觉”公众号,一个有价值有深度的公众号~)人群计数是通过计算机视觉计算人群数量,在公共安全和城市规划中有非常重要的应用。今天分享的文章通过改进网络对该任务的尺度不变性,显著提高了人群计数算法性能。
(欢迎关注“我爱计算机视觉”公众号,一个有价值有深度的公众号~)
人群计数是通过计算机视觉计算人群数量,在公共安全和城市规划中有非常重要的应用。今天分享的文章通过改进网络对该任务的尺度不变性,显著提高了人群计数算法性能。
文章来自几天前arXiv新上论文《Stacked Pooling: Improving Crowd Counting by Boosting Scale Invariance》,作者信息:
在计算机视觉中尺度不变是经常被讨论的话题,与其相关最著名的算法就是大名鼎鼎的SIFT(尺度不变特征变换)了。该论文作者通过观察发现,在人群计数这一领域,图像不同区域通过resize到相同大小,在尺度上具有高度的视觉相似性。请看下面这幅图:
来自同一幅图像和不同的图像经过resize,子图内的人物大小、人群密度、层叠关系视觉上很相似。
由于神经网络中池化层直接关系到网络的尺度变化,所以本文作者希望改进池化层,提高人群计数的算法性能。
作者在vanilla pooling基础上发明了两种池化层变种,multi-kernel pooling 和 stacked pooling。
multi-kernel pooling图示:
stacked pooling图示:
为验证所提的池化层的有效性,作者们使用VGG-13网络的各种变形来进行人群计数。网络的变化包括卷积核大小,网络宽度、深度等,如下图所示:
作者在ShanghaiTech-A数据集上验证multi-kernel pooling在高密度组比vanilla pooling要好,而在整个ShanghaiTech-B数据集上multi-kernel pooling都是更好的。
使用stacked pooling方法的各种网络变种都在ShanghaiTech数据集上比vanilla pooling好,且具有明显的性能提升。
在WorldExpo’10数据集上大部分场景也取得了更好的效果。
代码主页:
https://github.com/siyuhuang/crowdcount-stackpool
更多精彩推荐:
NVIDIA ECCV18论文:超像素采样网络助力语义分割与光流估计(代码将开源)
OpenCV深度学习文本检测示例程序(EAST text detector)
MaskFusion:惊艳的结合实例感知、语义分割、动态追踪的SLAM系统
(欢迎关注“我爱计算机视觉”公众号,一个有价值有深度的公众号~)
以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网
猜你喜欢:- 尺度不变提升人群计数性能
- 什幺是多尺度密集网络 – MSDNet ?
- 鱼和熊掌如何兼得?基于强化学习的多尺度信息传播预测
- 悉尼大学提出基于多尺度透射率估计去雾算法,消除照片上的雾霭烟霾
- 从宇宙大尺度结构到胎心监测,从手机消息推送到物联网大数据处理:跨界是创新的主要源泉
- 神经网络目标计数概述:通过Faster R-CNN实现当前最佳的目标计数
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
RabbitMQ实战
Alvaro Videla、Jason J. W. Williams / 汪佳南 / 电子工业出版社 / 2015-10 / 75.00元
本书对RabbitMQ做了全面、翔实的讲解,体现了两位专家的真知灼见。本书首先介绍了有关MQ的历史,然后从基本的消息通信原理讲起,带领读者一路探索RabbitMQ的消息通信世界。这当中不仅包含了针对单台RabbitMQ服务器和RabbitMQ集群的讲解,还教导读者如何使用各种工具来进行监控。 本书内容浅显易懂,文笔风趣幽默。书中包含了丰富的、可以运行的示例程序源代码,读者可以自行下载并运行,......一起来看看 《RabbitMQ实战》 这本书的介绍吧!