論文筆記: Efficient Net Rethinking

栏目: ASP.NET · 发布时间: 6年前

内容简介:這是一篇Google Research提出在ICML2019的文章,主要講述如何將現有模型,不用手動條參數的方式,改善模型的效能。目前改善模型的方式主要有三種,透過增廣模型,我們往往能夠取得更好的模型。根據圖片,三種方法的名詞解釋如下。1. Width : filter的數量

這是一篇Google Research提出在ICML2019的文章,主要講述如何將現有模型,不用手動條參數的方式,改善模型的效能。

名詞解釋

論文筆記: Efficient Net Rethinking

目前改善模型的方式主要有三種,透過增廣模型,我們往往能夠取得更好的模型。根據圖片,三種方法的名詞解釋如下。

1. Width : filter的數量

2. Depth 模型的層數

3. Resolution 輸入image的解析度

加大模型

論文筆記: Efficient Net Rethinking

由圖發現接近高精確度時,曲線快速的收斂,此時就算加大模型複雜度,成效也難以提升。

另外,作者發現這三種方式,並不是互相獨立的。從下圖可看出當resolution提升的時候,相對應的depth會變得十分重要。這從直觀上十分容易理解。

論文筆記: Efficient Net Rethinking

組合式加強

經過前述的觀察後,作者提出一個新的思路來加強模型

-compound scaling method-

首先將問題以最佳化的方式描述,限制式為運算平台擁有的的資源。
論文筆記: Efficient Net Rethinking

接著不同的depth width resolution 使用αβγ ϕ作為控制的參數,設定最佳化目標ACC(m)×[FLOPS(m)/T]w 。

論文筆記: Efficient Net Rethinking

實驗結果

論文筆記: Efficient Net Rethinking

ImageNet的競賽中,此篇方法在精準度、參數量、運算量都表現最好。

Resnet152提升的速度甚至可以達到5.7倍,十分驚人。

另外作者也有嘗試Cifar10 /100 Standford Car …..不同的dataset,效果也都是最佳。

論文筆記: Efficient Net Rethinking

從CAM圖中發現就算是在imagenet中取得良好分類結果的模型,在熱度圖中的敏感區域也都是模糊不清,但是經過本篇方法scale up的模型在高敏感區域更加集中且精準。

結語

這篇文章提出的想法十分簡單,運用自動化的方式調整模型將能減少大量的人力調參需求,不過深度學習的算法不只運用在分類問題,在偵測、語意分割、動作預測…..不同領域並沒有深入測試,所以是否能在較複雜的任務上使用這種簡單的最佳化方式scale up 模型還需要經過測試才能得知。


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

Web Designer Idea

Web Designer Idea

梁景红 / 电子工业出版社 / 2006年 / ¥55.00

这是一本以“目的、信息、设计、创意”作为根脉的关于网页视觉的书籍,畅谈的话题从策划到编辑再到设计,从而讨论“我们要建立怎样的站点,并以何种形式完成它”的问题。 全书共分四个部分,分别是网站建设目的,网站信息内容,页面形式设计,网页创作构思。 四部分有机地结合,形成一个统一的整体。“目的”部分以建设网站的目的为主,带领设计师从建站目的的角度,探讨如何抓住首要问题;如何建立网站雏形;如何打开狭隘的、局......一起来看看 《Web Designer Idea》 这本书的介绍吧!

HTML 编码/解码
HTML 编码/解码

HTML 编码/解码

UNIX 时间戳转换
UNIX 时间戳转换

UNIX 时间戳转换

RGB CMYK 转换工具
RGB CMYK 转换工具

RGB CMYK 互转工具