牛津大学|“不变信息聚类” :满足你对无监督深度聚类的一点幻想,Invariant Information Clustering

栏目: 数据库 · 发布时间: 6年前

内容简介:同时提供每月大咖直播分享、真实项目需求对接、干货资讯汇总,行业技术交流*延伸阅读

加入极市 专业CV交流群,与 6000+来自腾讯,华为,百度,北大,清华,中科院 等名企名校视觉开发者互动交流!更有机会与 李开复老师 等大牛群内互动!

同时提供每月大咖直播分享、真实项目需求对接、干货资讯汇总,行业技术交流 点击文末“ 阅读原文 ”立刻申请入群~

来源:David 9的博客

已获作者授权,请勿二次转载

人类是如此擅长“无监督”,以至于我们经常用肤浅的认知作出荒谬的结论。——David 9

人类擅长“无监督”,往往是因为“滥用” 过往的经验 妄下结论; 而AI模型的“无监督”,是对 数据 “妄下”的结论。自从有了深度网络的“大锤”,曾经传统聚类的钉子(k-means, 谱聚类等)似乎都被敲了一遍。

牛津大学|“不变信息聚类” :满足你对无监督深度聚类的一点幻想,Invariant Information Clustering

图像聚类和图像分割的无监督,来自:https://arxiv.org/pdf/1807.06653.pdf

而强行结合传统聚类的深度学习方法,缺乏语义过滤,谁能保证选取的特征都是对聚类任务有意义的?(回过头还得做 PCA 和白化)

别忘了, 人类妄下的结论,都是有语义因果(我们有内在逻辑) 。而机器对数据妄下的结论,缺乏因果联系。

为了摒弃传统聚类和神经网络的强拼硬凑, IIC(不变信息聚类) 被提出 。IIC没有用传统聚类,而是对CNN稍作改动,用 互信息最大化目标函数和双输入(two head) CNN的架构:

牛津大学|“不变信息聚类” :满足你对无监督深度聚类的一点幻想,Invariant Information Clustering

IIC架构,来自:https://arxiv.org/pdf/1807.06653.pdf

重要的地方有3点,

一, CNN网络用了 双输入 (不要误以为用了两个CNN,注意虚线部分是共享权重的)。为了做到无监督,模型每拿到一张图片x,都对这张图片做一次转换操作( 平移、旋转或crop )得到另一张图片 x’ 。因此,训练时是两次正向传播 + 一次反向传播 的模式,把x,x’两张图片的两个输出 z,z’ 一次性得到再做 loss 计算。

二, loss采用了 互信息最大化目标函数 

牛津大学|“不变信息聚类” :满足你对无监督深度聚类的一点幻想,Invariant Information Clustering

为了让模型总能在图像中辨认出(过滤出)相同类别的对象,与交叉熵(cross entropy)不同的是, 最大互信息 诱导出的z不会是杂乱无章的(cross entropy是对所有位一起做loss惩罚的)。 最大互信息会类似one hot key,诱导每一位独立代表一个类别。

三,IIC可以用overclustering做类别更多的聚类(把那些难以聚类的对象放在更多的抽屉)。对IIC来说只要把输出的 z,z’  维数进行扩大 。

综上,IIC极力让模型学到: “当对象类别一致时,网络输出z也应该非常相似”, 而最大互信息使得网络输出z有了更强的语义(对应的类别)。

比较违反直觉的是,这种无监督纯粹是把每张图像平移,旋转或crop得到 成对图片 的,模型最后能在这些成对图片中找到较好的聚类模式:

牛津大学|“不变信息聚类” :满足你对无监督深度聚类的一点幻想,Invariant Information Clustering

来自:https://github.com/xu-ji/IIC

参考文献:

  1. Invariant Information Clustering for Unsupervised Image Classification and Segmentation (https://arxiv.org/pdf/1807.06653.pdf)

  2. https://github.com/xu-ji/IIC

本文采用署名 – 非商业性使用 – 禁止演绎 3.0 中国大陆许可协议进行许可。著作权属于“David 9的博客”原创,如需转载,请联系邮箱:yanchao727@gmail.com

原文:

http://nooverfit.com/wp/%E4%B8%8D%E5%8F%98%E4%BF%A1%E6%81%AF%E8%81%9A%E7%B1%BB%EF%BC%9A%E6%BB%A1%E8%B6%B3%E4%BD%A0%E5%AF%B9%E6%97%A0%E7%9B%91%E7%9D%A3%E6%B7%B1%E5%BA%A6%E8%81%9A%E7%B1%BB%E7%9A%84%E4%B8%80%E7%82%B9/

*延伸阅读

点击左下角 阅读原文 ”, 即可申请加入极市 目标跟踪、目标检测、工业检测、人脸方向、视觉竞赛等技术交流群, 更有每月大咖直播分享、真实项目需求对接、干货资讯汇总,行业技术交流, 一起来让思想之光照的更远吧~

牛津大学|“不变信息聚类” :满足你对无监督深度聚类的一点幻想,Invariant Information Clustering

觉得有用麻烦给个在看啦~    牛津大学|“不变信息聚类” :满足你对无监督深度聚类的一点幻想,Invariant Information Clustering


以上所述就是小编给大家介绍的《牛津大学|“不变信息聚类” :满足你对无监督深度聚类的一点幻想,Invariant Information Clustering》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

Head First Design Patterns

Head First Design Patterns

Elisabeth Freeman、Eric Freeman、Bert Bates、Kathy Sierra、Elisabeth Robson / O'Reilly Media / 2004-11-1 / USD 49.99

You're not alone. At any given moment, somewhere in the world someone struggles with the same software design problems you have. You know you don't want to reinvent the wheel (or worse, a flat tire),......一起来看看 《Head First Design Patterns》 这本书的介绍吧!

图片转BASE64编码
图片转BASE64编码

在线图片转Base64编码工具

XML 在线格式化
XML 在线格式化

在线 XML 格式化压缩工具