牛津大学|“不变信息聚类” ：满足你对无监督深度聚类的一点幻想，Invariant Information Clustering

栏目: 数据库 · 发布时间: 5年前

内容简介：同时提供每月大咖直播分享、真实项目需求对接、干货资讯汇总，行业技术交流*延伸阅读

加入极市专业CV交流群，与 6000+来自腾讯，华为，百度，北大，清华，中科院 等名企名校视觉开发者互动交流！更有机会与 李开复老师 等大牛群内互动！

同时提供每月大咖直播分享、真实项目需求对接、干货资讯汇总，行业技术交流。点击文末“ 阅读原文 ”立刻申请入群~

来源：David 9的博客

已获作者授权，请勿二次转载

人类是如此擅长“无监督”，以至于我们经常用肤浅的认知作出荒谬的结论。——David 9

人类擅长“无监督”，往往是因为“滥用” 过往的经验 妄下结论; 而AI模型的“无监督”，是对数据 “妄下”的结论。自从有了深度网络的“大锤”，曾经传统聚类的钉子（k-means, 谱聚类等）似乎都被敲了一遍。

牛津大学|“不变信息聚类” ：满足你对无监督深度聚类的一点幻想，Invariant Information Clustering

图像聚类和图像分割的无监督，来自：https://arxiv.org/pdf/1807.06653.pdf

而强行结合传统聚类的深度学习方法，缺乏语义过滤，谁能保证选取的特征都是对聚类任务有意义的？（回过头还得做 PCA 和白化）

别忘了， 人类妄下的结论，都是有语义因果（我们有内在逻辑） 。而机器对数据妄下的结论，缺乏因果联系。

为了摒弃传统聚类和神经网络的强拼硬凑， IIC（不变信息聚类） 被提出。IIC没有用传统聚类，而是对CNN稍作改动，用 互信息最大化目标函数和双输入（two head） CNN的架构：

牛津大学|“不变信息聚类” ：满足你对无监督深度聚类的一点幻想，Invariant Information Clustering

IIC架构，来自：https://arxiv.org/pdf/1807.06653.pdf

重要的地方有3点，

一， CNN网络用了 双输入 （不要误以为用了两个CNN，注意虚线部分是共享权重的）。为了做到无监督，模型每拿到一张图片x，都对这张图片做一次转换操作（ 平移、旋转或crop ）得到另一张图片 x’ 。因此，训练时是两次正向传播 + 一次反向传播 的模式，把x，x’两张图片的两个输出 z，z’ 一次性得到再做 loss 计算。

二， loss采用了 互信息最大化目标函数 ：

牛津大学|“不变信息聚类” ：满足你对无监督深度聚类的一点幻想，Invariant Information Clustering

为了让模型总能在图像中辨认出（过滤出）相同类别的对象，与交叉熵（cross entropy）不同的是， 最大互信息 诱导出的z不会是杂乱无章的（cross entropy是对所有位一起做loss惩罚的）。最大互信息会类似one hot key，诱导每一位独立代表一个类别。

三，IIC可以用overclustering做类别更多的聚类（把那些难以聚类的对象放在更多的抽屉）。对IIC来说只要把输出的 z，z’ 维数进行扩大。

综上，IIC极力让模型学到： “当对象类别一致时，网络输出z也应该非常相似”， 而最大互信息使得网络输出z有了更强的语义（对应的类别）。

比较违反直觉的是，这种无监督纯粹是把每张图像平移，旋转或crop得到 成对图片 的，模型最后能在这些成对图片中找到较好的聚类模式：

牛津大学|“不变信息聚类” ：满足你对无监督深度聚类的一点幻想，Invariant Information Clustering

来自：https://github.com/xu-ji/IIC

参考文献：

Invariant Information Clustering for Unsupervised Image Classification and Segmentation （https://arxiv.org/pdf/1807.06653.pdf）
https://github.com/xu-ji/IIC

本文采用署名 – 非商业性使用 – 禁止演绎 3.0 中国大陆许可协议进行许可。著作权属于“David 9的博客”原创，如需转载，请联系邮箱：yanchao727@gmail.com

原文：

http://nooverfit.com/wp/%E4%B8%8D%E5%8F%98%E4%BF%A1%E6%81%AF%E8%81%9A%E7%B1%BB%EF%BC%9A%E6%BB%A1%E8%B6%B3%E4%BD%A0%E5%AF%B9%E6%97%A0%E7%9B%91%E7%9D%A3%E6%B7%B1%E5%BA%A6%E8%81%9A%E7%B1%BB%E7%9A%84%E4%B8%80%E7%82%B9/

*延伸阅读

点击左下角 “ 阅读原文 ”， 即可申请加入极市目标跟踪、目标检测、工业检测、人脸方向、视觉竞赛等技术交流群，更有每月大咖直播分享、真实项目需求对接、干货资讯汇总，行业技术交流，一起来让思想之光照的更远吧~

牛津大学|“不变信息聚类” ：满足你对无监督深度聚类的一点幻想，Invariant Information Clustering

觉得有用麻烦给个在看啦~

以上所述就是小编给大家介绍的《牛津大学|“不变信息聚类” ：满足你对无监督深度聚类的一点幻想，Invariant Information Clustering》，希望对大家有所帮助，如果大家有任何疑问请给我留言，小编会及时回复大家的。在此也非常感谢大家对码农网的支持！

查看所有标签

猜你喜欢:

本站部分资源来源于网络，本站转载出于传递更多信息之目的，版权归原作者或者来源机构所有，如转载稿涉及版权问题，请联系我们。

码农书籍

Hadoop in Action

Chuck Lam / Manning Publications / 2010-12-22 / USD 44.99

HIGHLIGHT Hadoop in Action is an example-rich tutorial that shows developers how to implement data-intensive distributed computing using Hadoop and the Map- Reduce framework. DESCRIPTION Hadoop i......一起来看看《Hadoop in Action》这本书的介绍吧!

码农工具