内容简介:同时提供每月大咖直播分享、真实项目需求对接、干货资讯汇总,行业技术交流*延伸阅读
加入极市 专业CV交流群,与 6000+来自腾讯,华为,百度,北大,清华,中科院 等名企名校视觉开发者互动交流!更有机会与 李开复老师 等大牛群内互动!
同时提供每月大咖直播分享、真实项目需求对接、干货资讯汇总,行业技术交流 。 点击文末“ 阅读原文 ”立刻申请入群~
作者 | autocyz
来源 | https://zhuanlan.zhihu.com/p/65307842
已获作者授权,请勿二次转载
论文:https://arxiv.org/abs/1904.08739
代码: https://github.com/wuzhe71/CPD
算法流程
上图(a)是目前比较流行的显著性检测方法的网络结构图,一般都是提取网络结构的浅层和深层feature,并对这些feature进行反卷积,并将反卷积得到的输出进行融合,得到最终的显著性图。
上图(b)是本文算法的流程。可以发现作者并没有使用前两个浅层的feature了,而是直接从第3个稍微深的feature开始使用。图中每个conv block之后,特征分辨率都会变小两倍。
1、提取第3、4、5个Conv block的feature,并通过一个解码器直接得到初步的显著性图
2、将此显著性图输入到一个Holistic attention module中,得到进一步的显著性图。
3、将
与第三个Conv block的特征进行元素相加,再次传入到两个Conv block中进行进一步特征提取
4、仿照第一步将特征传入decoder,得到了最终的显著性结果
具体细节
1、为何不适用浅层feature了
作者通过实验发现浅层的feature对于最终的显著性检测结果影响不大,但是运算消耗却很大。
例如下图(1)和图(2)。
图1 a是作者绘制的不同层的feature对最终的结果影响。发现第2和1层对结果的提升几乎没有影响。图1b 是运算时间,发现浅层feature的运算时间比较的大。
图2 是作者绘制的VGG16不同层输出的显著性结果。发现浅层显著性多集中于边缘信息,深层显著性才比较接近真正的显著性。
综上所述,作者没有使用前两层的feature,而直接从第三层feature开始使用。
2、loss计算
作者算法一共输出了两个显著性图 和 ,在最终计算loss的时候也将这两部分都用来做loss计算,每一部分都使用交叉熵作为loss函数。
3、Holistic Attention Module
这部分其实方法也非常的简单:
具体就是对于初步得到的显著性 ,使用一个高斯滤波器 对其进行滤波,再对滤波之后的结果进行min_max归一化,然后对显著图中的每个位置取归一化之后的结果和 中的最大值。
3、解码器(Decoder)
这部分实现也非常的简单,但是作者描述的有些复杂,建议看看代码,一下就懂了。主要操作就是使用不同大小的卷积和对每一层的特征进行进一步卷积,获得不同感受野。最后就是在不同层的feature之间进行有效的融合了。
实验
可以看到与DSS相比,无论是分数还是性能都有提升。所以说又快又好。
*延伸阅读
-
CVPR2019| 05-08更新12篇论文及代码合集(1篇oral,含医学图像分割/显著性检测/数据集等)
-
继往开来!目标检测二十年技术综述
-
中科院牛津华为诺亚提出:CenterNet,One-stage目标检测最强算法!可达47mAP,已开源!
点击左下角 “ 阅读原文 ”, 即可申请加入极市 目标跟踪、目标检测、工业检测、人脸方向、视觉竞赛等技术交流群, 更有每月大咖直播分享、真实项目需求对接、干货资讯汇总,行业技术交流, 一起来让思想之光照的更远吧~
觉得有用麻烦给个在看啦~
以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网
猜你喜欢:- OpenPCDet:点云3D目标检测开源库
- CVPR2019| 9篇CVPR论文开源代码(行人检测/物体检测/3D Face等)
- 目标检测的稀疏对抗攻击,代码已开源
- 牧云(CloudWalker)开源手记 | Webshell 监控检测策略初探
- 绝对不能错过的5款开源入侵检测工具
- 亚马逊提出目标检测训练秘籍(代码已开源)
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。