对话 Salesforce 首席科学家 Richard Socher：选择 ML 是出于对数学和语言的热爱

栏目: 编程工具 · 发布时间: 6年前

雷锋网 AI 科技评论按： 2018 年开始，NeuroAscent 联合创始人、数据科学家 Sanyam Bhutani 相继对 AI 领域一些优秀的从业者、研究者以及 kagglers 进行了采访，并在其博客中推出了系列文章，大家可前往以下地址查看 Sanyam Bhutani 的采访系列文：

https://hackernoon.com/interviews-with-machine-learning-heroes-504762ba5dd6

近日，Sanyam Bhutani 采访到了 Salesforce 的首席科学家 Richard Socher 教授。在采访中，Richard 根据自己当年的机器学习经历分享了自己的学习经验，并针对机器学习的研究成果、行业现状、面临的问题以及未来的发展表达了自己的见解。雷锋网 AI 科技评论编译如下。

对话 Salesforce 首席科学家 Richard Socher：选择 ML 是出于对数学和语言的热爱

今天，我很荣幸能采访到 Richard Socher 教授。Richard 是 Salesforce 的首席科学家，于斯坦福大学博士毕业，师从吴恩达和 Chris Channing 学习机器学习和 NLP。他曾是斯坦福大学深度学习与自然语言处理课程的讲师，现在则担任 NLP 标准公开课 CS224N 的慕课讲师。

以下为采访实录：

Sanyam Bhutani：Richard 您好，很感谢您能接受我的采访。

Dr. Richard Socher：我也要谢谢您选择采访我。

Sanyam Bhutani：现在，您在 Salesforce 担任首席科学家一职。您也曾是 NLP 领域最好、最有名的课程之一——斯坦福大学深度学习与自然语言处理课程的讲师，并拥有机器学习方向的博士学位。您能跟读者分享一下您是怎样开始学习机器学习的吗？是什么让您对深度学习产生了兴趣呢？

Dr. Richard Socher：从小到大我都对数学非常感兴趣，同时我也热爱语言，并坚信它们是人类智慧最有趣的产物以及将我们人类从本质上与动物区别开来。AI 能够让我将这些热爱都结合起来，并创造一些能改变这个世界的东西。我在德国开启我的求学生涯，之后来到美国攻读博士学位。

Sanyam Bhutani：刚刚博士毕业，您就选择了创立 MetaMind，而不是加入「科技巨头」，当时您是出于怎样的考量选择这条道路，为什么您认为这一选择是必然的？

Dr. Richard Socher：当我从斯坦福大学博士毕业时，我希望能够创造些什么，能够将深度学习所有的潜能都通通利用起来，而不仅仅是通过某个特定的应用来利用它很小的一部分。我在 2014 年创立 MetaMind，将它定义为对图像和文本数据进行分析、标注和预测的 AI 平台，来帮助企业做出更明智、更快速和更准确的决策。在 2016 年，MetaMind 被 Salesforce 收购，不过 Salesforce 允许我们这个小团队继续作为「爱因斯坦」项目的一部分，将 AI 能力赋予数百万位用户。

Sanyam Bhutani：到现在，您已经在最前沿的研究领域工作了十年左右，这些年工业界和学界的哪些发展成果是您最喜欢的？

Dr. Richard Socher：对于我团队在自然语言十项全能（Natural Language Decathlon，简称 decaNLP）上取得的最新成果，我感到无比兴奋和自豪。decaNLP 是一个学习可同时执行十项复杂的自然语言任务的通用 NLP 模型的新基准。工业界在 AI 模拟人类语言的能力上取得巨大进展的同时，decaNLP 将重新定义语言理解成功与否的基准，并为 AI 模型所能回答的问题类型开拓了新的可能性。在零样本学习技术的帮助下，decaNLP 拥有了一项人类独有的能力：模型对于从未见过的输入也可以进行推理

Sanyam Bhutani：可以说，自然语言处理的发展要落后于计算机视觉。您对于当前这种情况有什么看法？现在是开始成为一位 NLP 从业者的好时期吗？

Dr. Richard Socher：计算机视觉和语言理解面临着非常不同的挑战。在计算机视觉领域，我们凭借广泛到足以囊括大量图像类目的 ImageNet，取得了很多成果。结合了神经网络的 ImageNet，是能很好地处理许多不同视觉问题的默认模型。不过，NLP 与计算机视觉所面临的问题各不相同。语言理解要微妙得多，并且单个 NLP 任务或数据集无法应对语言理解整体的复杂性。

从很多方面来说， decaNLP 对于 NLP 的作用就相当于 ImageNet 对于计算机视觉的作用。由于问答太过广泛，并且你可以询问任意问题，因而我们可以将任意一个 NLP 问题视作一个问题——有什么看法？这句话翻译过来是什么？等等，——同时训练一个模型去同时执行几项任务。

Sanyam Bhutani：对于有志于从事自然语言处理工作的读者以及初学者，您最想给他们提出的建议是什么？

Dr. Richard Socher：对于初步接触到这一领域的学子，我推荐他们利用好网上的资源。例如我之前的斯坦福课程（cs224n.stanford.edu）就在网上对外开放了，并且 Salesforce 最近也在 Trailhead（Salesforce 的免费线上学习平台）上发布了一些 NLP 深度学习相关的不错的内容（内容查看地址： https://trailhead.salesforce.com/content/learn/trails/explore-deep-learning-for-nlp ）。

Sanyam Bhutani：目前这一领域的研究呈现爆发式的增长，您是怎样跟上最前沿的发展步伐的？

Dr. Richard Socher：我通常使用 Twitter 了解研究的最新动态，同时与该领域的其他人保持联系。

Sanyam Bhutani：得益于互联网，我能够有机会收听您精彩的主旨演讲以及讲座（我是您的粉丝）。

针对怎样有效地表达科技观点，您能分享一些技巧吗？

Dr. Richard Socher：我认为最好是简单地表达观点，并尝试去探讨 AI 在与人类相关的方面对他们所带来的影响。

Sanyam Bhutani：您是 AI 伦理的支持者，您能指出某些领域是我们即便在 AI 早期阶段也必须加以关注的吗？

Dr. Richard Socher：没有事实依据的担忧和实际发生的威胁之间是有区别的，AI 偏见是我们需要应对的即将到来的担忧，然而「世界末日论」则是一种危险的干扰。人们需要开始密切注意确保 AI 训练数据集的多样性和无偏见性以及团队要从多样的视角来创建这些 AI 系统。

Sanyam Bhutani：decaNLP 带来了一些非常有趣的成果。您怎样看待多任务学习？那么 NLP 以外的多任务学习呢？

Dr. Richard Socher：多任务学习对于让 AI 拥有更好的语境理解能力和直觉力至关重要。多任务学习能够让我们从相关的任务中收益，并最终获得更好的性能，而不会仅仅是专注于单任务的性能，从而可能导致丢失能够提升我们所关注的度量标准的重要信息。

Sanyam Bhutani：对于 AI 未来的发展，最让您激动的是什么？

您认为 Siri 有朝一日能帮我完成 CS224n 课程的作业吗？

Dr. Richard Socher：AI 在医疗领域具备一些潜力——可以让放射学和病理学更高效，同时可以帮助医生诊断人类肉眼可能发现不了的疾病。作为一位研究者，我很高兴看到 NLP 的突破性成果走出了实验室，并实现了产品化。在不久的将来，我认为将会有更自然和更具有直觉力的聊天机器人出现，它们能够对客户的服务电话进行恰当的回复，完成各类任务甚至向人类表达同情心。

Sanyam Bhutani：您是否有「机器学习被过度炒作」的感受？

Dr. Richard Socher：从人工智能出现开始，围绕 AI 的炒作就不断。从上世纪 50 年代开始，人们就一直在谈论像人类一样说话、走路和运动的 AI，但是现在我们也还是只能说——那是在接下来的几年时间里可以实现的未来。

AI 周围充斥着兴奋感是好的，并且作为一位研究者，我当然也很兴奋，但我们需要注意的是，不要在它们的实际能力以外去推算这一领域的突破，否则就会给人类带来困惑和误解。

Sanyam Bhutani：再次感谢您接受本次采访。

关于我的采访系列文：

最近，我开始推进我的机器学习自学之旅。但是说实话，如果没有这些出色的线上社区以及那些帮助过我的优秀的人，我无法取得这些进步。

在这个博客系列文中，我与那些真正对我起到了激励作用并被我当做人生导师的人进行了对话。

而我做这件事情背后的动力，你或许可以从这些我有机会学习的优秀的人身上找到答案，也希望你能从他们身上学到点什么。

大家如果对机器学习感兴趣，可以加入我一起自学机器学习（ https://hackernoon.com/launching-my-company-a-scholarship-and-a-webinar-277e3b66e351 ）。我的 Twitter 地址是 http://twitter.com/bhutanisanyam1 。

via： https://hackernoon.com/interview-with-chief-scientist-at-salesforce-dr-richard-socher-c982b9edcd12 雷锋网 (公众号：雷锋网) 雷锋网

雷锋网原创文章，未经授权禁止转载。详情见转载须知。

以上就是本文的全部内容，希望本文的内容对大家的学习或者工作能带来一定的帮助，也希望大家多多支持码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络，本站转载出于传递更多信息之目的，版权归原作者或者来源机构所有，如转载稿涉及版权问题，请联系我们。

码农书籍

TCP/IP网络管理

亨特 / 电子工业 / 2006年3月1日 / 79.00元

本书是一本架设与维护TCP／IP网络的完整指南，无论你是在职的系统管理员，还是需要访问Internet的家用系统用户，都可从本书获得帮助。本书还讨论了高级路由协议(RIPv2、OSPF、BGP)，以及实现这些协议的gated软件。对于各种重要的网络服务，如DNS，Apache，sendmail，Samba，PPP和DHCP，本书都提供了配置范例，以及相关的软件包与工具的语法参考。一起来看看《TCP/IP网络管理》这本书的介绍吧!

码农工具

对话 Salesforce 首席科学家 Richard Socher：选择 ML 是出于对数学和语言的热爱

TCP/IP网络管理

Base64 编码/解码

XML 在线格式化

HEX CMYK 转换工具