谷歌和 OpenAI 强强联手找到了神经网络「黑盒子」的正确打开方式！

栏目: 数据库 · 发布时间: 6年前

内容简介：神经网络已成为图像相关计算任务中的实际标准，目前已被部署在多种场景中：从自动标记图像库中的照片到自动驾驶系统，我们都能看到神经网络的身影。鉴于机器学习系统的在执行方面的准确性比不使用机器学习、直接由人为设计的系统更好，机器学习系统开始变得无处不在。但是，由于这些系统所了解的基本信息都是在自动训练过程中学习到的，因此我们对于网络处理其给定任务的整个过程的了解，有时仍然隔着一层纱。近期，经过与 OpenAI 同事的通力合作，我们在发表的《用激活图集探索神经网络》论文中（「Exploring Neural Net

雷锋网 (公众号：雷锋网) AI 科技评论按：现代神经网络经常被吐槽为「黑盒子」。尽管它们在各类问题上都取得了成功，但我们仍无法直观地理解它们是如何在内部做出决策的。随着人工智能系统被应用到更多重要的场景中，更好地了解其内部决策过程将有助于研究者能够及时发现其中的缺陷和错误。对此，谷歌 AI 研究院与 OpenAI 一起合作提出了能够弄清这个「黑盒子」里面到底有什么的新方法——激活图集。谷歌在博客上发布文章介绍了这一意义重大的成果，雷锋网 AI 科技评论编译如下。

神经网络已成为图像相关计算任务中的实际标准，目前已被部署在多种场景中：从自动标记图像库中的照片到自动驾驶系统，我们都能看到神经网络的身影。鉴于机器学习系统的在执行方面的准确性比不使用机器学习、直接由人为设计的系统更好，机器学习系统开始变得无处不在。但是，由于这些系统所了解的基本信息都是在自动训练过程中学习到的，因此我们对于网络处理其给定任务的整个过程的了解，有时仍然隔着一层纱。

近期，经过与 OpenAI 同事的通力合作，我们在发表的《用激活图集探索神经网络》论文中（「Exploring Neural Networks with Activation Atlases」，论文地址： https://distill.pub/2019/activation-atlas ）论文中，描述了一种新技术，旨在帮助回答「给定一张图像时，图像分类的神经网络能“看到”什么」的问题。激活图集提供了一种融入卷积视觉网络的新方法，为网络的隐藏层内部提供了一个全局的、层级化和可解释的概念综述。我们认为，激活图集揭示了机器针对图像学到的字母表，即一系列简单、基础的概念，它们被组合并重组进而形成更复杂得多的视觉概念。同时，我们还开源了部分 jupyter notebooks 的代码，以期帮助开发者们开始制作自己的激活图集。

InceptionV1 视觉分类网络其中一层的激活图的详细视图。它展示了网络用于对图像进行分类的许多视觉检测器，例如不同类型的水果状纹理，蜂窝图案和类似织物的纹理。

下面显示的激活图集是根据在 ImageNet 数据集上训练的卷积图像分类网络 Inceptionv1 构建的。通常，给分类网络输入一张图像，然后令其标记出该图像属于 1000 个预定类别中的哪一类，例如「意大利面」，「通气管」或「煎锅」。为此，我们通过一个约十层的网络来评估图像数据，该网络每层由数百个神经元组成，且对于不同类型的图块，每个神经元在图像块的激活程度不同。某层中的一个神经元可能对「狗耳朵」图像块的激活程度更大，而另一层的另一个神经元可能会对高对比度的「垂直线」图像更敏感。

我们从一百万张图像的神经网络的每个层中收集到了内部激活图，并构建了一套激活图集。这些激活图由一组复杂的高维向量表示，通过 UMAP 投影到有用的二维布局中，其中 UMAP 是一种保持原始高维空间局部结构的降维技术。

这就需要组织激活向量，并且因为激活图太多而无法一目了然，所以我们也需要将它们整合成一个更易于管理的数量。为此，我们在之前创建的 2D 布局上提前绘制好了网格。对于网格中的每个单元格，我们对位于其边界内的所有激活取均值，并使用特征可视化来创建图标表示。