簡介 R-CNN Region-based CNN

栏目: 数据库 · 发布时间: 5年前

内容简介:Ross Girshick Jeff Donahue Trevor Darrell Jitendra MalikR-CNN是由 Ross Girshick (RBG 大神) 等人提出,方法如下。Region Proposal 就是上面第2部分中多個黃色框框,找尋region proposal 的方法有很多種,可以是最簡單的 Sliding Window(方框大小固定並掃過)或是這篇Paper所使用的 Selective Search 由 Felzenszwal 於 2004 年提出

Ross Girshick Jeff Donahue Trevor Darrell Jitendra Malik Rich feature hierarchies for accurate object detection and semantic segmentation , 2014

R-CNN是由 Ross Girshick (RBG 大神) 等人提出,方法如下。

  1. 產生一群約 2000 個可能的區域 (Region Proposals)
  2. 用原圖訓練一個CNN模型(提取特徵用)。
  3. 將Region Proposals resize後輸入訓練好的CNN模型提取特徵。
  4. 然後再將特徵以 SVM (Support Vector Machine) 分類器來區分是否為物體或者背景。
  5. 最後經由一個線性回歸模型來校正 bounding box 位置。
簡介 R-CNN Region-based CNN

Region Proposal

Region Proposal 就是上面第2部分中多個黃色框框,找尋region proposal 的方法有很多種,可以是最簡單的 Sliding Window(方框大小固定並掃過)或是這篇Paper所使用的 Selective Search 由 Felzenszwal 於 2004 年提出 Graph Base Image Segmentation

Selective Search

Selective Search 使用階層群聚演算法 以 Graph Based Segmentation 的結果為基礎,進行階層式的合併 (會根據顏色、紋理、大小、形狀相似度優先對區塊較為相似的部分進行合併),然後產生最後的候選區域。

簡介 R-CNN Region-based CNN

但是 R-CNN 有些重大的問題

  1. 一開始必須先產生約 2000 個區域,每個區域都要進 CNN 中提取特徵,所以需要跑過至少 2000 次的 CNN。速度太慢,一張圖片需要50秒才有辦法辨識完成。
  2. 模型分成三部份,取出特徵的 CNN,分類的 SVM,以及 bounding box 的線性回歸,訓練繁瑣。

所以 原作者Ross Girshick 在 2015 年又提出了一個改良版本,Fast R-CNN。

參考資料:

關於影像辨識,所有你應該知道的深度學習模型

Rich feature hierarchies for accurate object detection and semantic segmentation

OpenCV 教學:實作 Selective Search 物體偵測候選區域演算法


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

Fortran95程序设计

Fortran95程序设计

彭国伦 / 中国电力出版社 / 2002-9 / 59.00元

本书介绍了当前国际上广泛流行的高级算法语言Fortran的全新版本Fortran 95。 本书循序渐进、由浅到深,使用结构化及面向对象程序设计观念,以简捷明了的方式把Fortran 95介绍给读者。书中主要讲述了Fortran 95程序设计的方法,包括数值计算、计算机绘图、窗口程序设计、与Visual C/Visual Basic/Delphi的链接、甚至是游戏程序的编写。 本书语言简洁,实......一起来看看 《Fortran95程序设计》 这本书的介绍吧!

XML、JSON 在线转换
XML、JSON 在线转换

在线XML、JSON转换工具

RGB HSV 转换
RGB HSV 转换

RGB HSV 互转工具