内容简介:同时提供每月大咖直播分享、真实项目需求对接、干货资讯汇总,行业技术交流*延伸阅读
加入极市 专业CV交流群,与 6000+来自腾讯,华为,百度,北大,清华,中科院 等名企名校视觉开发者互动交流!更有机会与 李开复老师 等大牛群内互动!
同时提供每月大咖直播分享、真实项目需求对接、干货资讯汇总,行业技术交流 。 点击文末“ 阅读原文 ”立刻申请入群~
来源:David 9的博客
已获作者授权,请勿二次转载
人类是如此擅长“无监督”,以至于我们经常用肤浅的认知作出荒谬的结论。——David 9
人类擅长“无监督”,往往是因为“滥用” 过往的经验 妄下结论; 而AI模型的“无监督”,是对 数据 “妄下”的结论。自从有了深度网络的“大锤”,曾经传统聚类的钉子(k-means, 谱聚类等)似乎都被敲了一遍。
而强行结合传统聚类的深度学习方法,缺乏语义过滤,谁能保证选取的特征都是对聚类任务有意义的?(回过头还得做 PCA 和白化)
别忘了, 人类妄下的结论,都是有语义因果(我们有内在逻辑) 。而机器对数据妄下的结论,缺乏因果联系。
为了摒弃传统聚类和神经网络的强拼硬凑, IIC(不变信息聚类) 被提出 。IIC没有用传统聚类,而是对CNN稍作改动,用 互信息最大化目标函数和双输入(two head) CNN的架构:
重要的地方有3点,
一, CNN网络用了 双输入 (不要误以为用了两个CNN,注意虚线部分是共享权重的)。为了做到无监督,模型每拿到一张图片x,都对这张图片做一次转换操作( 平移、旋转或crop )得到另一张图片 x’ 。因此,训练时是两次正向传播 + 一次反向传播 的模式,把x,x’两张图片的两个输出 z,z’ 一次性得到再做 loss 计算。
二, loss采用了 互信息最大化目标函数 :
为了让模型总能在图像中辨认出(过滤出)相同类别的对象,与交叉熵(cross entropy)不同的是, 最大互信息 诱导出的z不会是杂乱无章的(cross entropy是对所有位一起做loss惩罚的)。 最大互信息会类似one hot key,诱导每一位独立代表一个类别。
三,IIC可以用overclustering做类别更多的聚类(把那些难以聚类的对象放在更多的抽屉)。对IIC来说只要把输出的 z,z’ 维数进行扩大 。
综上,IIC极力让模型学到: “当对象类别一致时,网络输出z也应该非常相似”, 而最大互信息使得网络输出z有了更强的语义(对应的类别)。
比较违反直觉的是,这种无监督纯粹是把每张图像平移,旋转或crop得到 成对图片 的,模型最后能在这些成对图片中找到较好的聚类模式:
参考文献:
-
Invariant Information Clustering for Unsupervised Image Classification and Segmentation (https://arxiv.org/pdf/1807.06653.pdf)
-
https://github.com/xu-ji/IIC
本文采用署名 – 非商业性使用 – 禁止演绎 3.0 中国大陆许可协议进行许可。著作权属于“David 9的博客”原创,如需转载,请联系邮箱:yanchao727@gmail.com
原文:
http://nooverfit.com/wp/%E4%B8%8D%E5%8F%98%E4%BF%A1%E6%81%AF%E8%81%9A%E7%B1%BB%EF%BC%9A%E6%BB%A1%E8%B6%B3%E4%BD%A0%E5%AF%B9%E6%97%A0%E7%9B%91%E7%9D%A3%E6%B7%B1%E5%BA%A6%E8%81%9A%E7%B1%BB%E7%9A%84%E4%B8%80%E7%82%B9/
*延伸阅读
点击左下角 “ 阅读原文 ”, 即可申请加入极市 目标跟踪、目标检测、工业检测、人脸方向、视觉竞赛等技术交流群, 更有每月大咖直播分享、真实项目需求对接、干货资讯汇总,行业技术交流, 一起来让思想之光照的更远吧~
觉得有用麻烦给个在看啦~
以上所述就是小编给大家介绍的《牛津大学|“不变信息聚类” :满足你对无监督深度聚类的一点幻想,Invariant Information Clustering》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!
猜你喜欢:- “不变信息聚类”:满足你对无监督深度聚类的一点幻想,Invarient Information Clustering 深度网络...
- 尺度不变提升人群计数性能
- 尺度不变网络提升人群计数性能
- FPGA的变与不变 | 智慧产品圈
- 不同虚拟机间共享不变的 Table
- 强大的姿势感知模型用于姿势不变的人脸识别
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
21天学通C语言
(美国)琼斯(Bradley L.Jones) (美国)埃特肯(Peter Aitken) / 信达工作室 / 人民邮电出版社 / 2012-8 / 69.00元
《21天学通C语言(第6版•修订版)》是初学者学习C语言的经典教程。本版按最新的标准(ISO∕IEC:9899-1999),以循序渐进的方式介绍了C语言编程方面知识,并提供了丰富的实例和大量的练习。通过学习实例,并将所学的知识用于完成练习,读者将逐步了解、熟悉并精通C语言。《21天学通C语言(第6版•修订版)》包括四周的课程。第一周的课程介绍了C语言程序的基本元素,包括变量、常量、语句、表达式、函......一起来看看 《21天学通C语言》 这本书的介绍吧!