定向Dropout和L0正则，for.ai与Hinton老爷子的神经网络蒸馏、剪枝与量化新研究，稀疏化神经网络，控...

栏目: 数据库 · 发布时间: 5年前

内容简介：“信息”技术的开垦只是刚刚开始，对于AI工作者也许更恰当的一个名称是“信息控制师” — David 9人脑可以随时拿出一个模型处理周围信息，而不是等待别人告诉它怎么处理信息。现在所谓”深度学习”的风口，其实都只能归为信息科技。cnn做了

“信息”技术的开垦只是刚刚开始，对于AI工作者也许更恰当的一个名称是“信息控制师” — David 9

人脑可以随时拿出一个模型处理周围信息，而不是等待别人告诉它怎么处理信息。现在所谓”深度学习”的风口，其实都只能归为信息科技。 这种需要人工告诉模型如何处理信息的智能，David姑且称为“信息控制智能”。

cnn做了 自动的信息解构 提取， rnn 把 时序间的信息 收集提取， gan 把模糊化的 loss信息学习 提取，包括今天要聊到的 Dropout 和 L0 正则都是对网络学到的 内部信息 做了控制。

如果大家知道神经网络 蒸馏、剪枝或者模型压缩和量化 ，大家愈发会感到：这些就是实实在在的 “信息工具” 而已。拿 L0正则 举例（其实L1, L2正则都类似），L0能做到的只是把所有的非０权重 以同样的力量拉扯到０ ，使得网络学到的参数信息更稀疏，L1, L2不同之处只是对于不同大小的参数θ ， 拉扯的力量不同而已 ：

定向Dropout和L0正则，for.ai与Hinton老爷子的神经网络蒸馏、剪枝与量化新研究，稀疏化神经网络，控... — 来自：https://arxiv.org/abs/1712.01312

同样，for.ai与Hinton老爷子提出的定向 Dropout（ targeted-dropout ） 也可以用来压缩模型(但不丢失信息或少丢失信息)。“ 彩票假设 ”的提出者们认为，一个密集、随机初始化的前向神经网络都可以找到一个子网络（所谓的彩票），能够比较稀疏并且和原网络差别极小的性能。

定向Dropout（ targeted-dropout ）就可以帮助我们找到这样的子网络，所谓“定向”，就是对那些 权重量较小的连接 ，有目标地进行 dropout ：

本质上，指定那些不那么重要的权重连接，在训练时dropout，是 把那些不重要的连接所携带的信息拉扯到其他权重连接上 ，这样，在信息不丢失的基础上，最后可以把信息压缩到一个比较小的神经网络，达到压缩模型的作用。

定向 Dropout（ targeted-dropout ） 的试验也证明，使用定向Dropout后，网络的权重连接变稀疏了，并且 权重连接与权重连接之间的互信息增强了 :

上图中x轴和y轴分别代表两个权重连接，如果两个权重连接之间的信息依赖度较高，那么颜色偏绿色（反之偏红色），当然在对角线上的点是同一个连接和自己比较当然依赖度很高。可以注意到，右图使用了 targeted-dropout 后，依赖更密集了，模型也压缩的更小了。

最后的模型效果David无需多言了，使用 targeted-dropout 可以保证在剪枝较多神经网络后依然有较高的准确率：

参考文献：

本文采用署名 – 非商业性使用 – 禁止演绎 3.0 中国大陆许可协议进行许可。著作权属于“David 9的博客”原创，如需转载，请联系微信: david9ml，或邮箱：yanchao727@gmail.com

或直接扫二维码:

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络，本站转载出于传递更多信息之目的，版权归原作者或者来源机构所有，如转载稿涉及版权问题，请联系我们。

码农书籍

创业时, 我们在知乎聊什么?

知乎 / 中信出版社 / 2014-1 / 42.00元

★前所未有的互联网出版实验，500万知友亲手甄选内容，知乎三年创业问答精华大集结 ★史上最真诚创业书，用互联网思维讲透创业的逻辑 ★在知乎，最强大互联网创业群体真实分享创业路上的荣耀与隐忧 ★从Idea到步入正轨，创业公司如何招人、做技术、卖产品、找融资、建团队、处理法务？他们在知乎聊创业：创新工场创始人李开复天使投资人徐小平小米科技创始人雷军......一起来看看《创业时, 我们在知乎聊什么?》这本书的介绍吧!

码农工具