内容简介:Ross Girshick Jeff Donahue Trevor Darrell Jitendra MalikR-CNN是由 Ross Girshick (RBG 大神) 等人提出,方法如下。Region Proposal 就是上面第2部分中多個黃色框框,找尋region proposal 的方法有很多種,可以是最簡單的 Sliding Window(方框大小固定並掃過)或是這篇Paper所使用的 Selective Search 由 Felzenszwal 於 2004 年提出
Ross Girshick Jeff Donahue Trevor Darrell Jitendra Malik Rich feature hierarchies for accurate object detection and semantic segmentation , 2014
R-CNN是由 Ross Girshick (RBG 大神) 等人提出,方法如下。
- 產生一群約 2000 個可能的區域 (Region Proposals)
- 用原圖訓練一個CNN模型(提取特徵用)。
- 將Region Proposals resize後輸入訓練好的CNN模型提取特徵。
- 然後再將特徵以 SVM (Support Vector Machine) 分類器來區分是否為物體或者背景。
- 最後經由一個線性回歸模型來校正 bounding box 位置。
Region Proposal
Region Proposal 就是上面第2部分中多個黃色框框,找尋region proposal 的方法有很多種,可以是最簡單的 Sliding Window(方框大小固定並掃過)或是這篇Paper所使用的 Selective Search 由 Felzenszwal 於 2004 年提出 Graph Base Image Segmentation 。
Selective Search
Selective Search 使用階層群聚演算法 以 Graph Based Segmentation 的結果為基礎,進行階層式的合併 (會根據顏色、紋理、大小、形狀相似度優先對區塊較為相似的部分進行合併),然後產生最後的候選區域。
但是 R-CNN 有些重大的問題
- 一開始必須先產生約 2000 個區域,每個區域都要進 CNN 中提取特徵,所以需要跑過至少 2000 次的 CNN。速度太慢,一張圖片需要50秒才有辦法辨識完成。
- 模型分成三部份,取出特徵的 CNN,分類的 SVM,以及 bounding box 的線性回歸,訓練繁瑣。
所以 原作者Ross Girshick 在 2015 年又提出了一個改良版本,Fast R-CNN。
參考資料:
Rich feature hierarchies for accurate object detection and semantic segmentation
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网
猜你喜欢:本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
CSS3专业网页开发指南
Peter Gasston / 李景媛、吴晓嘉 / 人民邮电出版社 / 2014-3-1 / 45.00元
《CSS3专业网页开发指南》是英国著名Web前端开发工程师Peter Gasston对CSS3高级技术的全面介绍。书中既有CSS3的发展历史、基本语法等入门知识介绍,也涵盖了媒体查询、选择器、伪类与伪元素、网页字体、文本排版、图形处理、动画、布局等CSS3前端开发必不可少的知识,还介绍了CSS3的未来发展方向。全书共分为17章,作者在每一章的讲解中都结合了大量的实例,同时也不忘介绍每一项技术的发展......一起来看看 《CSS3专业网页开发指南》 这本书的介绍吧!