如何构建一个器学习项目来找到工作?

栏目: 数据库 · 发布时间: 6年前

内容简介:雷锋网我是一个在 YC 初创公司工作的物理学家。我们的工作是帮助刚毕业的学生得到他们的第一份机器学习工作。前一段时间,我写了一篇关于如何才能获得第一份机器学习工作的文章。我在那篇文章中说,有一件你应该做的事是建立个人机器学习项目。但我并没有说明如何去做这件事,所以在这篇文章里,我会告诉你怎么做。

雷锋网 (公众号:雷锋网) AI 科技评论按:如何找到一份机器学习的工作?对于这个问题, SharpestMindsAI 创始人、物理学家和机器学习专家 Edouard Harris 写了一篇博客,雷锋网 AI 科技评论整理。

我是一个在 YC 初创公司工作的物理学家。我们的工作是帮助刚毕业的学生得到他们的第一份机器学习工作。

前一段时间,我写了一篇关于如何才能获得第一份机器学习工作的文章。我在那篇文章中说,有一件你应该做的事是建立个人机器学习项目。但我并没有说明如何去做这件事,所以在这篇文章里,我会告诉你怎么做。

由于工作原因,我看到过成百上千的个人项目的例子,它们有的非常好,有的很糟糕。下面我将给你讲讲其中的两个非常好的项目。

全力以赴地投入项目

下面是一个真实的故事,只是为了保护隐私,我改了名字。

当杂货店需要更新库存的时候,X 公司使会用人工智能去提醒它们。我们有一个名叫 Ron 的学生,他真的很想去 X 公司工作。Ron 实在是太想去 X 公司工作了,因此,他投入所有的精力建立了一个个人项目,这个项目让他得到了 X 公司的面试机会。

像这样全力以赴地为进入一家公司做准备是一件冒险的事情,我们通常不建议这样做。但是我在前面说过,Ron 真的非常想去 X 公司工作。

那么 Ron 建立了一个什么样的个人项目?

如何构建一个器学习项目来找到工作?

红色的矩形框表示缺货

  1. Ron 先把手机绑到购物车上,之后他推着购物车在杂货店的过道上来回走动,同时用相机把杂货店的货架拍摄下来。他在不同的杂货店做了 10 到 12 次这样的工作。

  2. Ron 一到家,就开始着手建立机器学习模型。他的模型可以识别出杂货店货架上没有货物的地方,这些地方的玉米片(或其他东西)被拿走了。

  3. Ron 在 GitHub 上实时构建模型,并完全公开。每天,他都会对自己的模型进行改进来提高它的准确性,并记录其中的变化。

  4. 当注意到 Ron 所做的事情时,X 公司表现出了极大的兴趣。事实上,X 公司甚至对此感到紧张。他们为什么会紧张?因为 Ron 不知不觉地在几天内重构了他们的专有的技术栈的一部分。

X 公司实力强劲,他们的技术在同行业中首屈一指。尽管如此,在 4 天之内,Ron 的项目已经引起了 X 公司 CEO 的注意。

试验项目

这是另一个真实的故事。

Alex 是历史系的学生,同时他辅修了俄语研究。不同于其他历史专业的学生,他对机器学习特别感兴趣。更不寻常的是,尽管从未写过一行 Python 代码,他决定去学习机器学习。

Alex 选择通过实践来学习。他决定建立一个分类器来检测飞机上的飞行员是否失去意识。Alex 想通过观看飞行员的视频来探索这个问题。人们很容易通过观察就能判断一个飞行员是否失去意识,所以 Alex 认为机器也有可能做到这一点。

以下是 Alex 花了几个月做的事情:

如何构建一个器学习项目来找到工作?

Alex 的意识丧失感应探测器模型 G-force

  1. Alex 在 YouTube 上下载了从驾驶舱里拍摄的飞行员驾驶飞机的每个视频片段。

  2. 接下来,他开始标记数据。Alex 创建了一个 UI,他可以在上面滚动观看数千个视频片段,这个 UI 上有两个按钮,按其中一个按钮显示「有意识」,按另一个按钮显示「无意识」。按下按钮后,当前视频片段会被自动保存在正确标记的文件夹中。这个过程非常无聊,花了他很多很多天的时间。

  3. Alex 为这些图像建立了一条数据管道,可以将飞行员从驾驶舱的背景中裁剪出来,以便使他的分类器更容易地将注意力集中在飞行员身上。最后,他建立了他的意识丧失分类器。

  4. 在做这些工作的同时,Alex 也在社交活动中向招聘经理展示他项目的照片。每次当他拿出手机展示他的项目时间,他们问会他是怎么做到这些的,关于他如何建造管道,以及他如何收集数据。但是他们从来没有抽出时间去问过他的模型的精确度--低于 50%。

Alex 当然打算提高他的准确性,但是在做这个事情之前他就被录用了。事实证明,他的项目所带来的视觉冲击,以及他在数据收集方面不屈不挠、足智多谋的特质,对公司来说比他的模型实际有多好更重要。

我提过 Alex 是主修历史辅修俄语研究吗?

他们有什么共同点?

是什么让 Ron 和 Alex 如此成功?因为他们做到了下面四点:

  1. Ron 和 Alex 没有花太多精力去建模。我知道这听起来很奇怪,但是对于现在许多用例来说,建模是一个已经解决的问题。在真正的工作中,除非你做的是最先进的人工智能研究,否则无论如何,你将花费 80-90% 的时间来清理数据。是什么让你的个人项目与众不同?

  2. Ron和Alex收集了他们自己的数据。正因为如此,它们最终得到的数据比 Kaggle 或 UCI 数据库中的数据更混乱。但是这些混乱的数据教会了他们如何处理混乱数据。相比从学术服务器下载数据,这种方式让他们更好地理解了他们的数据。

  3. Ron 和 Alex 创造了可以被看到的东西。面试不是让你的技能被一个通晓一切的面试官客观地评估,而是一个向别人推销自己的过程。人类是视觉动物。所以,拿出你的手机,向面试官展示你所做的一切吧,确保你所做的看起来很有趣是值得的。

  4. Ron 和 Alex 的所作所为看起来很疯狂,实际上也很疯狂。一般人不会把手机绑在购物车上。普通人不会花时间从 YouTube 视频中裁剪飞行员,你知道谁会干这种事情吗?想尽所有办法都要达到目标的人。而公司真的很想雇佣这些人。

Ron 和 Alex 看起来似乎做了太多的工作,但实际上,这并不比你在一份真正的工作中所需要做的事情多。这就是最关键的一点:当你没有做 X 的工作经验时,招聘经理会从你做过的事情中寻找那些和 X 相关的事情。

幸运的是,你只需要构建一两个项目---Ron 和 Alex 的项目在他们所有的面试中被反复使用。

因此,如果要我用一句话概括一个伟大的机器学习项目的秘密,那就是:构建一个带有一个有趣的数据集的项目,这个数据集必须是花费了显而易见的努力收集来的,并使这个项目尽可能给人以深刻的视觉印象。

雷锋网

雷锋网版权文章,未经授权禁止转载。详情见 转载须知

如何构建一个器学习项目来找到工作?

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

知识的边界

知识的边界

[美] 戴维·温伯格 / 胡泳、高美 / 山西人民出版社 / 2014-12-1 / 42.00元

大数据时代反思知识 因为事实不再是事实,专家随处可见 所有确定性都被连根拔起,话题再无边界,没有人对任何事情能达成一致。 在互联网的引领下,知识现在已经具有了社交性,流动且开放。温伯格向我们展示了这些特点如何可以为我们所用。 ——马克•贝尼奥夫(云计算之父,著有《云攻略》) 这本富有洞见的著作,奠定了温伯格作为数字时代最重要的思想家之一的地位。如果你想要理解信息洪流涌......一起来看看 《知识的边界》 这本书的介绍吧!

Base64 编码/解码
Base64 编码/解码

Base64 编码/解码

XML 在线格式化
XML 在线格式化

在线 XML 格式化压缩工具

RGB HSV 转换
RGB HSV 转换

RGB HSV 互转工具