Cascade R-CNN 升级!目标检测制霸 COCO,实例分割超越 Mask R-CNN

栏目: 数据库 · 发布时间: 5年前

内容简介:前天,arxiv上新出一篇论文《Cascade R-CNN: High Quality Object Detection and Instance Segmentation》,目标检测算法Cascade R-CNN 原作者对其进行扩展应用于实例分割。

我爱计算机视觉 标星,更快获取CVML新技术

前天,arxiv上新出一篇论文《Cascade R-CNN: High Quality Object Detection and Instance Segmentation》,目标检测算法Cascade R-CNN 原作者对其进行扩展应用于实例分割。

Cascade R-CNN 升级!目标检测制霸 COCO,实例分割超越 Mask R-CNN

两位作者均来自加州大学圣地亚哥分校,这可能是一篇投向TPAMI的论文。

在目标检测的实验中,借助于骨干网ResNeXt-152 的加持,在COCO数据集上AP达到50.9,超越之前的SOTA TridentNet算法的48.4,在实例分割实验中精度也显著高于Mask R-CNN。

Cascade R-CNN 是什么?

Cascade R-CNN 是2017年末出的目标检测算法,它的核心思想是:

使用不同的IOU阈值,训练多个级联的检测器。

它可以用于级联已有的检测器,取得更加精确的目标检测。

描述Cascade R-CNN算法的论文被CVPR 2018录用,该文一出,曾经相当长时间位于COCO检测数据集精度榜首(后被图森的TridentNet超越,这次又超了回来。。。)。

谷歌学术显示:

Cascade R-CNN 升级!目标检测制霸 COCO,实例分割超越 Mask R-CNN

原论文已有111次引用。

作者开源了代码, 该算法曾经被 COCO 2018 instance segmentation challenge , OpenImage 2018 challenge ,  Wider Challenge 2018 的获胜团队使用(作者文中声称)。

Cascade R-CNN 网络结构

网络结构如下图b,

Cascade R-CNN 升级!目标检测制霸 COCO,实例分割超越 Mask R-CNN

公式表示就是这样的:

上图中b和c很像,iterative bbox at inference 是在推断时候对回归框进行后处理,即生成了之后在多次处理,而Cascade R-CNN 在训练的时候就进行重新采样,不同的stage的输入数据分布已经是不同的了。

Cascade Mask R-CNN 网络结构

受Mask R-CNN发,作者将 Cascade R- CNN 推广到实例分割很简单,作者提供了三种策略,分别对应下图中b、c、d中将分割头S放在不同的位置。

Cascade R-CNN 升级!目标检测制霸 COCO,实例分割超越 Mask R-CNN

实验结果

作者在通用目标检测、实例分割数据集COCO上进行了实验,换上骨干网ResNeXt-152的 Cascade R- CNN 又刷出了新高度!AP 达到50.9。如下图:

Cascade R-CNN 升级!目标检测制霸 COCO,实例分割超越 Mask R-CNN

使用不同的检测器和骨干网,级联后都能获得大幅度的精度提升,如下图:

Cascade R-CNN 升级!目标检测制霸 COCO,实例分割超越 Mask R-CNN

同时可见,级联后推断速度有少许变慢,但在可接受的范围内。

下图是将Cascade Mask R-CNN与基线版本比较的结果,在实例分割任务中,也取得了明显的精度提升。

Cascade R-CNN 升级!目标检测制霸 COCO,实例分割超越 Mask R-CNN

在PASCAL VOC 2007 数据集上同样表现出,使用级联后均获得精度提升。

Cascade R-CNN 升级!目标检测制霸 COCO,实例分割超越 Mask R-CNN

作者又在一些特殊目标类、不同数据集上做了实验。

下图为在KITTI车辆类的检测结果:

Cascade R-CNN 升级!目标检测制霸 COCO,实例分割超越 Mask R-CNN

在CityPersons验证集分割的结果,和在WIderFace数据集上人脸检测结果:

Cascade R-CNN 升级!目标检测制霸 COCO,实例分割超越 Mask R-CNN

均表明该算法能一致性的提高精度。

论文地址:

https://arxiv.org/abs/1906.09756v1

代码地址:

https://github.com/zhaoweicai/cascade-rcnn(Caffe版)

代码地址:

https://github.com/zhaoweicai/Detectron-Cascade-RCNN( Detectron 版)

目标检测专业交流群

关注最新最前沿的目标检测技术,欢迎加入52CV-目标检测专业交流群,扫码添加CV君拉你入群(如已为CV君好友,请直接私信, 不必重复添加 ),

请务必注明:目标检测 ):

Cascade R-CNN 升级!目标检测制霸 COCO,实例分割超越 Mask R-CNN

喜欢在QQ交流的童鞋可以加52CV官方QQ群: 702781905

(不会时时在线,如果没能及时通过还请见谅)

Cascade R-CNN 升级!目标检测制霸 COCO,实例分割超越 Mask R-CNN

长按关注 我爱计算机视觉


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

Professional JavaScript for Web Developers

Professional JavaScript for Web Developers

Nicholas C. Zakas / Wrox / 2009-1-14 / USD 49.99

This eagerly anticipated update to the breakout book on JavaScript offers you an in-depth look at the numerous advances to the techniques and technology of the JavaScript language. You'll see why Java......一起来看看 《Professional JavaScript for Web Developers》 这本书的介绍吧!

图片转BASE64编码
图片转BASE64编码

在线图片转Base64编码工具

Markdown 在线编辑器
Markdown 在线编辑器

Markdown 在线编辑器

HEX HSV 转换工具
HEX HSV 转换工具

HEX HSV 互换工具