Cascade R-CNN 升级!目标检测制霸 COCO,实例分割超越 Mask R-CNN

栏目: 数据库 · 发布时间: 5年前

内容简介:前天,arxiv上新出一篇论文《Cascade R-CNN: High Quality Object Detection and Instance Segmentation》,目标检测算法Cascade R-CNN 原作者对其进行扩展应用于实例分割。

我爱计算机视觉 标星,更快获取CVML新技术

前天,arxiv上新出一篇论文《Cascade R-CNN: High Quality Object Detection and Instance Segmentation》,目标检测算法Cascade R-CNN 原作者对其进行扩展应用于实例分割。

Cascade R-CNN 升级!目标检测制霸 COCO,实例分割超越 Mask R-CNN

两位作者均来自加州大学圣地亚哥分校,这可能是一篇投向TPAMI的论文。

在目标检测的实验中,借助于骨干网ResNeXt-152 的加持,在COCO数据集上AP达到50.9,超越之前的SOTA TridentNet算法的48.4,在实例分割实验中精度也显著高于Mask R-CNN。

Cascade R-CNN 是什么?

Cascade R-CNN 是2017年末出的目标检测算法,它的核心思想是:

使用不同的IOU阈值,训练多个级联的检测器。

它可以用于级联已有的检测器,取得更加精确的目标检测。

描述Cascade R-CNN算法的论文被CVPR 2018录用,该文一出,曾经相当长时间位于COCO检测数据集精度榜首(后被图森的TridentNet超越,这次又超了回来。。。)。

谷歌学术显示:

Cascade R-CNN 升级!目标检测制霸 COCO,实例分割超越 Mask R-CNN

原论文已有111次引用。

作者开源了代码, 该算法曾经被 COCO 2018 instance segmentation challenge , OpenImage 2018 challenge ,  Wider Challenge 2018 的获胜团队使用(作者文中声称)。

Cascade R-CNN 网络结构

网络结构如下图b,

Cascade R-CNN 升级!目标检测制霸 COCO,实例分割超越 Mask R-CNN

公式表示就是这样的:

上图中b和c很像,iterative bbox at inference 是在推断时候对回归框进行后处理,即生成了之后在多次处理,而Cascade R-CNN 在训练的时候就进行重新采样,不同的stage的输入数据分布已经是不同的了。

Cascade Mask R-CNN 网络结构

受Mask R-CNN发,作者将 Cascade R- CNN 推广到实例分割很简单,作者提供了三种策略,分别对应下图中b、c、d中将分割头S放在不同的位置。

Cascade R-CNN 升级!目标检测制霸 COCO,实例分割超越 Mask R-CNN

实验结果

作者在通用目标检测、实例分割数据集COCO上进行了实验,换上骨干网ResNeXt-152的 Cascade R- CNN 又刷出了新高度!AP 达到50.9。如下图:

Cascade R-CNN 升级!目标检测制霸 COCO,实例分割超越 Mask R-CNN

使用不同的检测器和骨干网,级联后都能获得大幅度的精度提升,如下图:

Cascade R-CNN 升级!目标检测制霸 COCO,实例分割超越 Mask R-CNN

同时可见,级联后推断速度有少许变慢,但在可接受的范围内。

下图是将Cascade Mask R-CNN与基线版本比较的结果,在实例分割任务中,也取得了明显的精度提升。

Cascade R-CNN 升级!目标检测制霸 COCO,实例分割超越 Mask R-CNN

在PASCAL VOC 2007 数据集上同样表现出,使用级联后均获得精度提升。

Cascade R-CNN 升级!目标检测制霸 COCO,实例分割超越 Mask R-CNN

作者又在一些特殊目标类、不同数据集上做了实验。

下图为在KITTI车辆类的检测结果:

Cascade R-CNN 升级!目标检测制霸 COCO,实例分割超越 Mask R-CNN

在CityPersons验证集分割的结果,和在WIderFace数据集上人脸检测结果:

Cascade R-CNN 升级!目标检测制霸 COCO,实例分割超越 Mask R-CNN

均表明该算法能一致性的提高精度。

论文地址:

https://arxiv.org/abs/1906.09756v1

代码地址:

https://github.com/zhaoweicai/cascade-rcnn(Caffe版)

代码地址:

https://github.com/zhaoweicai/Detectron-Cascade-RCNN( Detectron 版)

目标检测专业交流群

关注最新最前沿的目标检测技术,欢迎加入52CV-目标检测专业交流群,扫码添加CV君拉你入群(如已为CV君好友,请直接私信, 不必重复添加 ),

请务必注明:目标检测 ):

Cascade R-CNN 升级!目标检测制霸 COCO,实例分割超越 Mask R-CNN

喜欢在QQ交流的童鞋可以加52CV官方QQ群: 702781905

(不会时时在线,如果没能及时通过还请见谅)

Cascade R-CNN 升级!目标检测制霸 COCO,实例分割超越 Mask R-CNN

长按关注 我爱计算机视觉


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

最优状态估计

最优状态估计

[美] D. 西蒙 / 张勇刚、李宁、奔粤阳 / 国防工业出版社 / 2013-5-1 / 68.00元

《最优状态估计——卡尔曼H∞及非线性滤波》共分为四个部分,全面介绍了最优状态估计的理论和方法。第1部分为基础知识,回顾了线性系统、概率论和随机过程相关知识,介绍了最小二乘法、维纳滤波、状态的统计特性随时间的传播过程。第2部分详细介绍了卡尔曼滤波及其等价形式,介绍了卡尔曼滤 波的扩展形式,包括相关噪声和有色噪声条件下的卡尔曼滤波、稳态滤波、衰减记忆滤波和带约束的卡尔 曼滤波等。第3部分详细介绍了H∞......一起来看看 《最优状态估计》 这本书的介绍吧!

RGB转16进制工具
RGB转16进制工具

RGB HEX 互转工具

随机密码生成器
随机密码生成器

多种字符组合密码

MD5 加密
MD5 加密

MD5 加密工具