CVPR2019:好的模型,迁移学习效果就更好吗?Google Brain最新结论

栏目: 编程工具 · 发布时间: 6年前

内容简介:特征工程的下一步可能是如何直接操控特征(同域或不同域),而不仅仅是特征选择或特征过滤— David 9相信很多初学迁移学习的朋友心里一直有个疑问:根据Google Brain在

特征工程的下一步可能是如何直接操控特征(同域或不同域),而不仅仅是特征选择或特征过滤— David 9

相信很多初学迁移学习的朋友心里一直有个疑问: 迁移学习的模型真的对新应用效果也好吗?更好的迁移模型,在其他应用上表现效果也更好吗?

根据Google Brain在 CVPR 2019 的研究总结,今天David偷懒一次,只说结论:

答案很大程度上是肯定的!Google Brain的大量实验证明,无论是把 神经网络倒数第二层 直接拿出来做预测,还是把预训练模型对新应用进行 “二次训练”好的imagenet预训练模型普遍有更好的迁移学习效果

CVPR2019:好的模型,迁移学习效果就更好吗?Google Brain最新结论
来自:《Do Better ImageNet Models Transfer Better?》

如上,左图是直接把网络倒数第二层特征直接拿出来进行迁移学习(使用Logistic Regression),右图是在新应用上find-tuned的迁移学习表现。可以注意到, 只要是模型本来表现就好(横左标),迁移的效果就更好(纵坐标) 。从性能最差的MobileNet到性能最好的Inception-ResNet无一例外。

但是,迁移学习并不是就无敌了。文章指出, 在迁移学习中一定要慎用正则化 ,正则方法如 ( Dropout, Label Smooth ) 用得越少,直接把倒数第二层特征迁移后,效果就越好:

CVPR2019:好的模型,迁移学习效果就更好吗?Google Brain最新结论
来自:《Do Better ImageNet Models Transfer Better?》

上图从左到右顺着横坐标,是在模型中去掉一些正则化方法的迁移效果,其中 “+”号 是模型中使用的方法, “-”号 是模型中未使用的方法。因为BN(batch norm)不是正则化方法,不会影响迁移学习效果。Dropout就是一种后期的正则化处理,这种操作是对迁移学习有影响的。

而如果你一定要使用正则化方法,并且要对模型做迁移,建议还是需要(用新数据)fine-tune一下迁移模型,这样对迁移效果影响较小:

CVPR2019:好的模型,迁移学习效果就更好吗?Google Brain最新结论
来自:《Do Better ImageNet Models Transfer Better?》

另外,并不是所有迁移学习都能达到显著效果:

CVPR2019:好的模型,迁移学习效果就更好吗?Google Brain最新结论
来自:《Do Better ImageNet Models Transfer Better?》

文章指出,对于 find-grained 分类数据集( 大类中含小类,小类中还能分类 ),如果数据量小的话,迁移学习确实有用,而如果数据量非常大,从头开始训练和迁移学习最后的效果差别不大。如上图,每个点是模型在一个数据集上 迁移学习从头训练 的准确率。

参考文献:

  1. Do Better ImageNet Models Transfer Better?
  2. http://www.cs.umd.edu/~djacobs/CMSC733/FineGrainedClassification.pdf

本文采用 署名 – 非商业性使用 – 禁止演绎 3.0 中国大陆许可协议 进行许可。著作权属于“David 9的博客”原创,如需转载,请联系微信: david9ml,或邮箱:yanchao727@gmail.com

或直接扫二维码:

CVPR2019:好的模型,迁移学习效果就更好吗?Google Brain最新结论

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

Java RESTful Web Service实战

Java RESTful Web Service实战

韩陆 / 机械工业出版社 / 2014-10-1 / 69.00

国内首本完整、深度地讲解如何基于Java标准规范实现REST风格的Web服务的专著,阿里巴巴Java技术专家12年开发经验结晶,3位业内著名技术专家联袂推荐!不仅深刻解读了最新的JAX-RS标准和其API设计,以及Jersey的使用要点和实现原理,而且系统讲解了REST的基本理论,更重要的是从实践角度深度讲解了如何基于Jersey实现完整的、安全的、高性能的REST式的Web服务。 《Jav......一起来看看 《Java RESTful Web Service实战》 这本书的介绍吧!

图片转BASE64编码
图片转BASE64编码

在线图片转Base64编码工具

Base64 编码/解码
Base64 编码/解码

Base64 编码/解码

html转js在线工具
html转js在线工具

html转js在线工具