她拒绝麦肯锡 Offer,建立图片训练数据库,斯坦福 AI 实验室负责人 | 人物志

栏目: 数据库 · 发布时间: 5年前

内容简介:“只有人文精神才拥有连接科技与人类社会的力量。 ”——李飞飞[1]

她拒绝麦肯锡 Offer,建立图片训练数据库,斯坦福 AI 实验室负责人 | 人物志

“只有人文精神才拥有连接科技与人类社会的力量。 ”——李飞飞[1]

她拒绝麦肯锡 Offer,建立图片训练数据库,斯坦福 AI 实验室负责人 | 人物志

作者 | 数小妹

责编 | 伍杏玲

本文经授权转载自DataGirls(ID:DataGirls)

2019年3月19日,在斯坦福大学“以人为本AI研究院”正式成立的峰会上,聚齐一众大佬:

微软创始人比尔·盖茨、加州州长Gavin Newsom、谷歌Jeff Dean,DeepMind创始人Demis Hassabis,加州大学伯克利分校心理学家Alison Gopnik、知名投资人Reid Hoffman等人聚齐一堂。

而该研究院的负责人,正是华裔女科学家,李飞飞。

她拒绝麦肯锡 Offer,建立图片训练数据库,斯坦福 AI 实验室负责人 | 人物志

李飞飞是谁?

她36岁成为斯坦福大学终身教授,任斯坦福人工智能实验室和视觉实验室主任;

她的高质量论文,在顶级期刊发表超过100篇,被引用高达4万余次;

她参与建立的两个数据库:Caltech 101 和 ImageNet 被 AI 研究者广泛使用,其中的 ImageNet 更是成为全球最大的图像识别数据库;

她是学术界最顶尖的科学家之一......

作为一名华裔女性,李飞飞的影响力不只在学术界。

2015年,李飞飞入选2015年“全球百大思想者”,被评为美国“年度杰出移民”之一(爱因斯坦、基辛格也曾获此殊荣);

2018年3月,获影响世界华人大奖”[2]......

回首过往,她曾对英文一窍不通,为了生活去做过清洁工、中餐馆收银员,甚至帮人遛过狗,还到处借钱开干洗店。

曾经的打工少女,是如何一步步走到今天的呢?

她拒绝麦肯锡 Offer,建立图片训练数据库,斯坦福 AI 实验室负责人 | 人物志

美国梦,无惧前行

20世纪70年代,李飞飞生于成都。

那时的成都,远没有今天繁华。但是,李飞飞的父母特别注重培养她的好奇心,一有展览就带她去,让她接触到更大的世界、更新奇的事物。

同时,家里还有一条很有趣的家规:李飞飞放学回家后只能在40分钟内做作业,40分钟后就可以看课外书、可以玩,干啥都可以,但就是不能再做作业[3]。

父母此举,就是为了让李飞飞养成专注高效的习惯,做事不拖延,不左顾右盼。这样,就可以为自己留出充足时间,做自己感兴趣的事。       

李飞飞16岁时,全家移民到了美国。面对一个语言、文化完全迥异的环境,李飞飞和家人的最大障碍是:如何生存下去?

语言不通,迫于生计。受过高等教育的父母来到美国后,也失去了原本在中国的知识分子的工作,父亲成了照相机修理工,母亲成了超市收银员,勉强维持温饱。

全家人住在纽约附近一个叫帕西帕尼(Parsippany)的地方,全家人仅有的一些朋友都是和他们一样的移民,“大家都很忙,忙着讨生活”。

除了上学,李飞飞还要尽可能补贴家用,课余时间去中餐馆、洗衣店打零工。

打工和上学,就成了她适应美国新生活的全部内容,最辛苦时一天睡不到4小时。

她在16岁第一次踏上美国土地时, 几乎不会说英语,竟在高中毕业时,以 SAT(美国高考)1250 分 ,数学满分的成绩被世界名校普林斯顿大学物理系录取,而且获得了全额奖学金。

这样优异的成绩,连美国人都很难达到,当地报纸专门采访报道了她,引起一时轰动。

她最大的欣喜是发现身边朋友起了变化,“身边全是这些学术、知性、充满魅力的人”,[1]她说。

上大学后,李飞飞仍坚持勤工俭学,以贴家用。她四处向朋友、甚至中学数学老师借钱,买下了一家干洗店。

如同“双城记”,帕西帕尼和普林斯顿。

周一到周五,她在普林斯顿学物理,放学后通过电话参与干洗店的经营,周末她就回到帕西帕尼给家里的干洗店帮忙,接待那些来取送衣物干洗的人。“我非常爱普林斯顿,不过也非常爱我的洗衣店,缺少了它们中的任何一件,都没有现在的我”[2],她说。

她拒绝麦肯锡 Offer,建立图片训练数据库,斯坦福 AI 实验室负责人 | 人物志

拒绝高薪,去西藏探秘

1999年,从普林斯顿大学毕业之后,李飞飞的就业前景一片大好。

大学毕业时,他们都可以选择两条路。从普林斯顿大学出来,就业机会非常乐观。但 李飞飞坚信,她的路不是常人走的路。

当时美国最大的两大投资公司——高盛和麦肯锡都给过她工作Offer,但李飞飞均拒绝了。

“认为上清华、哈佛就是优秀,是一个非常表面的认识。实际上,上了名牌大学,只是对你过去的一份肯定。真正的路,你自己后面还有很长的路要走。 在我看来,仅为挣一份六位数美元的高薪,而没有理想的人,也算是碌碌无为。” [4]

她拒绝麦肯锡 Offer,建立图片训练数据库,斯坦福 AI 实验室负责人 | 人物志

在李飞飞的生命中,有一种很“野”的元素。她疯狂地想去探索东西哲学和科学中的奥妙,去做东西文化的桥梁。

本科物理学的她,竟对西藏医药产生了浓厚的兴趣。

恰逢机遇,普林斯顿有面对毕业生Martin A. Dale ’53 奖学金,  全校仅有一个名额,学校要求申请人,写一个提案,用一年的时间,去探索世界。这个计划必须由本人亲自设计,亲自完成。

那届学生,有1200多个人申请Dale奖学金, 李飞飞的课题是“藏医学和西医学上的医理比较”, 经过两轮的面试和答辩,她如愿拿到了这份奖学金。

就这样,她的间隔年计划开始了。不认识任何当地人,更没有人知晓她是谁。带着探索热情和研究计划,李飞飞背起行囊,去了西藏。         

当时,研究需要在高原寒区风餐露宿,这对一直生活在城市中的女孩是个很大的挑战。

但飞飞从未有过任何抱怨,而是愉快地融入到当地生活中,与藏地的医生和牧民打成一片。

“房间里没有床,我随便找来一个垫子,放在地上。 没有洗澡的地方,冷风呼呼地刮,不通水,不通电。我骑马进山,跟牧民一样,大口吃生肉。即使这样,我还是很快乐,与藏族人一起,我在学习和体验一种精神。 ”[4]       

这段经历对她影响很大。

“虽然有些东西看起来没用,比如我去研究藏药,但只要是深思熟虑过的、认准的,之后肯定会起到作用的,别心急。”[4]

长久以来,西方的科学方法论和哲学思维占据学术界的主导地位,而以藏医药为切入点,李飞飞体会到整个人类思想宝库中完全不同的另一面。

直到现在,李飞飞的推特账号背景,还是藏文化。     

西藏归来之后,李飞飞选择继续读博,这意味着这段时间她还是只有微薄的奖学金,全家人仍然要承受经济的不宽裕。

博士期间,李飞飞的母亲接连患上了癌症与中风。那是一段艰苦的日子,经历了很多困难,但最后都挺过来了。

人生最大的挑战,其实是不辜负你最大的潜能,又不辜负你身上的责任,以及诚实面对你自己内心所希望追求的事业” [1],2017年,她在接受CNN采访时这样说。

她拒绝麦肯锡 Offer,建立图片训练数据库,斯坦福 AI 实验室负责人 | 人物志

让计算机理解图片

间隔年结束后,李飞飞同样收到了大量的咨询公司Offer。但李飞飞还是想坚守以学术研究造福世界的梦想,不为金钱,不为地位,也不为环境所迫。

在父母支持和自己的辛勤努力下,李飞飞拿到了加州理工学院电子工程专业的博士学位,具体研究方向是人工智能和计算神经科学。

李飞飞一头扎进当时的冷门研究中——如何让计算机理解图片。

计算机如果要越来越广泛地被人们所使用,就必须习得认知画面的能力。最简单的例子是,当自动驾驶的汽车前方路面出现了一个障碍物时,计算机需要识别那是个可以轻松碾过去的纸袋子还是个应该避开的石头。

那么,计算机怎么学会识别图像呢?

比如,让计算机识别猫,首先要告诉计算机,猫是圆脸、胖身子、两只尖耳朵和一条长尾巴构成的东西。

她拒绝麦肯锡 Offer,建立图片训练数据库,斯坦福 AI 实验室负责人 | 人物志

然而现实生活中,猫的品种有成千上万,就算同一只猫,也可能摆出不同姿势,这个时候,计算机可能就不知所措了。

面对图像识别如此匮乏的“词汇量”,李飞飞开始“训练”计算机,让它看更多图片。

2007年起,她在网上下载了近10亿幅图片,然后给它们分类、打标签,建立题库为计算机看图训练而用。但由于工作量过大,几个月后研究经费几乎用光,而且,照此进度需十几年才能完成建立题库的目标。

在最困难时,李飞飞甚至想过重操旧业开干洗店筹集经费。       

一筹莫展时,美国最大电商亚马逊的众包平台帮了大忙。李飞飞在网上雇佣了167个国家共计5万人,给10亿张图片筛选、 排序 、打标签。

今天,这个数据集包含了使用日常英语标记的超过 1400 万张图像,跨越 21800 个类别。它就是大名鼎鼎的ImageNet数据库。

更可贵的是,ImageNet 如此庞大的图片数据是免费的。它向全球开放,所有致力于计算机视觉识别技术的团队,都能从它里面直接拿“试题”,训练自家识别技术的准确率。

如今,计算机识别的错误率已经从28%降到3.6%,比人眼识别错误率5.1%还要低。这都要归功于 ImageNet 数据库以及李飞飞团队的努力。

2009年,年仅36岁的李飞飞获得了斯坦福的终身副教授职位。李飞飞更一直担任斯坦福人工智能实验室和视觉实验室的负责人,她不仅是斯坦福AI实验室唯一的女性,还是计算机系最年轻的副教授。

她拒绝麦肯锡 Offer,建立图片训练数据库,斯坦福 AI 实验室负责人 | 人物志

AI+人文=更广阔的未来

斯坦福以人为本AI研究院(Stanford Human-Centered AI Institute)的成立想法,始于2016年李飞飞和教务长John Etchemendy的一次邻居对话,这场科学家和哲学家的随意交谈很快变得更有分量。

李飞飞说:“我们需要将人文和社会思想融入到科技中。”       

她接着解释最近的想法:建设科技未来的人,似乎有着相似的背景,他们都在数学、计算机科学和工程等领域。没有足够多的哲学家,历史学家和行为学家能够影响新技术的发展。

多样性是一个重要议题。科技领域不仅需要穿帽衫的男生,也需要穿短裙的女生;不仅需要计算机、工程背景的团队,还需要经济学家、历史学家、社会学家等有人文社会科学背景的人才加入,用人文精神给AI赋能。

2019年3 月 18 日,斯坦福以人为本 AI 研究院成立了。这所研究院由斯坦福大学七所学院的 200 名教师组成,同时计划从人文、工程、医学、艺术或者基础科学等领域招募至少 20 名新教师,其中包括 10 名初级研究员,同时与 AI4All, AI100, AI Index 等组织展开合作。

斯坦福利用 HAI 评估智能机器对人类生活所造成的影响,包括机器自动化取代了部分人力工作,算法引起的性别和种族偏见,医疗、教育和司法系统中存在的 AI 问题。

研究院虽然才刚刚成立,但是已经向斯坦福各学院,约 55 个跨学科研究小组提供了支持。其中包括帮助难民重新安置,改善重症监护室医疗服务系统,以及研究自动驾驶汽车对社会治理和基础设施的影响。

她拒绝麦肯锡 Offer,建立图片训练数据库,斯坦福 AI 实验室负责人 | 人物志

从以人为本的初衷出发,发布会上李飞飞也强调了 HAI 需要遵守的三个原则:

第一,Human-发展 AI 的过程中必须考虑 AI 对人类社会的影响;

第二,Augment-AI 的应用是为了赋能人类,而非取代人类;

第三,Intellect-人工智能应该更多融入人类智慧的多样性、差异性和深度。

虽然,近年来AI 发展出了一些非凡的能力,但它仍远远落后于神经元、人类智能的微妙和灵活性。当一种算法在拥挤的街道上驾驶汽车或促成假释听证会的结果时,流畅的人类经验是至关重要的。

这张简单的照片可以说明 AI 和人类智能的区别。当今最先进的计算机视觉算法可以很容易地识别它们眼前的对象,比如狗、沙发、人、咖啡杯等等。       

但作为人类,我们看到了什么?我们不仅能知道沙发坏了,还知道是狗干的。我们还可以从一个简单的姿势看出,主人不是很开心。更神奇的,我们可能是从狗脸上的内疚表情中看出来的,而且马上就能看出来。这些就是人脑所做的。我们毫不费力地就能识别环境并唤起记忆。我们能感觉到事件之间的因果关系,把一系列的瞬间变成一个故事。

“我们是见证AI从实验室走入现实的第一代人,我们是见证它以前所未有的速度和规模向前发展的一代人,”李飞飞说,“从历史上看,技术所产生的回响远远超越了技术本身。”[2]       

当后来有人问李飞飞,你是如何克服路上这些困难的时候。

她说:“我是一个拼命三郎,这是我的DNA使然” 。[5]

因为在她眼里,如果总是去感叹为什么会有那么多的困难,这才是浪费时间和一件分散注意力的事情,还不如一心往前冲。

从成都到普林斯顿,从斯坦福再到谷歌,如今再度重重返校园的李飞飞,一直在路上。

让人类世界变得更好,是李飞飞的追求。

而李飞飞的目标,也一直是整个世界。

参考资料:

[1]华西悦读.《AI+人文=?李飞飞抱怨AI界太多“帽衫男”》

[2]插座学院.崔永旺.《谷歌最高华裔主管李飞飞离职:既要担起生活的责任,又要对得起梦想》

[3]搜狐.《领军AI的华裔女性——李飞飞 》

[4]陈屹视线.《采访:硅谷精英李飞飞-20年前已是女神》

[5]环球人物.《做“佛系青年”,她从清洁工逆袭成首席科学家!》

【END】

她拒绝麦肯锡 Offer,建立图片训练数据库,斯坦福 AI 实验室负责人 | 人物志

 热 文推 荐 

阿里火力全开 IoT!

天才少年,大学创业,29 岁创立 Coinbase!| 人物志

云在物联网中的惊人优势 | 技术头条

太嚣张!程序员别再闷头学机器学习了

补偿100万?Oracle裁900+程序员,新方案已出!

你点的每个“在看”,我都认真当成了喜欢


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

Redis开发与运维

Redis开发与运维

付磊、张益军 / 机械工业出版社 / 2017-3-1 / 89.00

本书全面讲解Redis基本功能及其应用,并结合线上开发与运维监控中的实际使用案例,深入分析并总结了实际开发运维中遇到的“陷阱”,以及背后的原因, 包含大规模集群开发与管理的场景、应用案例与开发技巧,为高效开发运维提供了大量实际经验和建议。本书不要求读者有任何Redis使用经验,对入门与进阶DevOps的开发者提供有价值的帮助。主要内容包括:Redis的安装配置、API、各种高效功能、客户端、持久化......一起来看看 《Redis开发与运维》 这本书的介绍吧!

SHA 加密
SHA 加密

SHA 加密工具

XML 在线格式化
XML 在线格式化

在线 XML 格式化压缩工具

HEX CMYK 转换工具
HEX CMYK 转换工具

HEX CMYK 互转工具