尺度不变提升人群计数性能

栏目: 编程工具 · 发布时间: 7年前

内容简介:(欢迎关注“我爱计算机视觉”公众号,一个有价值有深度的公众号~)人群计数是通过计算机视觉计算人群数量,在公共安全和城市规划中有非常重要的应用。本文通过改进网络的尺度不变性,显著提高了人群计数算法性能。

(欢迎关注“我爱计算机视觉”公众号,一个有价值有深度的公众号~)

人群计数是通过计算机视觉计算人群数量,在公共安全和城市规划中有非常重要的应用。本文通过改进网络的尺度不变性,显著提高了人群计数算法性能。

尺度不变提升人群计数性能

该文来自昨天Arxiv新上论文《Stacked Pooling: Improving Crowd Counting by Boosting Scale Invariance》,作者信息:

尺度不变提升人群计数性能

在计算机视觉中尺度不变是经常被涉及的话题,与其相关最著名的算法就是SIFT(尺度不变特征变换)了。本文作者通过观察发现,在人群计数这一领域,图像不同区域通过resize到相同大小,在尺度上具有高度的视觉相似性。请看下面这幅图:

尺度不变提升人群计数性能

来自同一幅图像和不同的图像经过resize,子图内的人物大小、人群密度、层叠关系视觉上很相似。

由于神经网络中池化层直接关系到网络的尺度变化,所以本文作者希望改进池化层,提高人群计数的算法性能。

作者在vanilla pooling基础上发明了两种池化层变种,multi-kernel pooling 和 stacked pooling。

multi-kernel pooling图示:

尺度不变提升人群计数性能 stacked pooling图示:

尺度不变提升人群计数性能

为验证所提的池化层的有效性,作者们使用VGG-13网络的各种变形来进行人群计数。网络的变化包括卷积核大小,网络宽度、深度等,如下图所示:

尺度不变提升人群计数性能

作者在ShanghaiTech-A数据集上验证multi-kernel pooling在高密度组比vanilla pooling要好,而在整个ShanghaiTech-B数据集上multi-kernel pooling都是更好的。

尺度不变提升人群计数性能

使用stacked pooling方法的各种网络变种都在ShanghaiTech数据集上比vanilla pooling好,且具有明显的性能提升。

尺度不变提升人群计数性能

在WorldExpo’10数据集上大部分场景也取得了更好的效果。

尺度不变提升人群计数性能

代码主页:

https://github.com/siyuhuang/crowdcount-stackpool

点击阅读原文可以在www.52cv.net查看本文。

更多精彩推荐:

NVIDIA ECCV18论文:超像素采样网络助力语义分割与光流估计(代码将开源)

OpenCV深度学习文本检测示例程序(EAST text detector)

MaskFusion:惊艳的结合实例感知、语义分割、动态追踪的SLAM系统

(欢迎关注“我爱计算机视觉”公众号,一个有价值有深度的公众号~)

尺度不变提升人群计数性能

【本文由“我爱计算机视觉”发布,2018年08月24日】


以上所述就是小编给大家介绍的《尺度不变提升人群计数性能》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

引爆点

引爆点

[美] 马尔科姆·格拉德威尔 / 钱清、覃爱冬 / 中信出版社 / 2006-1 / 29.80元

这本书是《纽约客》杂志专职作家马尔科姆·格拉德威尔的一部才华横溢之作。他以社会上突如其来的流行风潮研究为切入点,从一个全新的角度探索了控制科学和营销模式。他认为,思想、行为、信息以及产品常常会像传染病爆发一样,迅速传播蔓延。正如一个病人就能引起一场全城流感;如果个别工作人员对顾客大打出手,或几位涂鸦爱好者管不住自己,也能在地铁里掀起一场犯罪浪潮;一位满意而归的顾客还能让新开张的餐馆座无虚席。这些现......一起来看看 《引爆点》 这本书的介绍吧!

Markdown 在线编辑器
Markdown 在线编辑器

Markdown 在线编辑器

正则表达式在线测试
正则表达式在线测试

正则表达式在线测试

RGB HSV 转换
RGB HSV 转换

RGB HSV 互转工具