[译] 理想数据科学家的画像是什么样的?

栏目: 数据库 · 发布时间: 5年前

内容简介:本文是TalkingData University翻译自George Liu 发表在towardsdatascience的一篇文章。在昨天的推送中,

本文是TalkingData University翻译自George Liu 发表在towardsdatascience的一篇文章。

在昨天的推送中, George 给出了不同角色数据人才能力画像,本文是他通过分析Indeed网站的招聘信息进一步分析得到的结果。 【阅读原文】 可查看英文原文。

感兴趣的同学,还可发送关键词  数据人才报告”  至本公众号,看看报告中TDU和美世咨询如何定义数据人才的不同角色及能力集。

前篇: 数据科学职业全景导航 【点击阅读】

如果您是数据科学方向的求职者,您一定想知道在您的简历添加哪些技能可以让您接到面试电话;如 果您想进入这个 领域,您可能想破脑袋想知道学习哪些技能才能成为更有吸引力的候选人。

来吧,我有你想要的答案。

首先,我们来看看不同岗位的技能要求。

R与 Python 之争已经结束,因为Python现在是主导者

曾经有人争论过到底Python和R谁才是数据科学的首选语言。显然,市场需求告诉我们 Python现在是领导者 。同样值得注意的是,R甚至比SAS更少提到。因此,如果您正在考虑进入数据科学领域,请考虑将您的学习重点放在Python上。 SQL作为数据库的语言(也可能是数据!),是数据科学家第二重要的语言。由于数据科学家职业的广泛性,其他语言也扮演着重要角色。

总结:数据科学家的主要语言是:Python,SQL,Scala,Lua,Java,SAS,R,C ++和Matlab。

机器学习工程师所需的语言更加多样化

作为机器学习的实际语言, Python 当选机器学习工程师的 首选语言 并不令人惊讶。而从头开始实现算法,并在大数据环境中部署ML模型,使得C ++和Scala等相关语言也很重要。总的来说,与其他两个角色相比,机器学习工程师对编程语言的需求似乎更加分散。

总结:机器学习工程师的主要语言是:Python,Scala,Java,C ++,Lua,SQL,Javascript,Matlab,CSS和C#。

如果你想成为一名数据工程师,SQL绝对是必备的

数据工程师始终在处理数据库,SQL是数据库语言,所以毫无疑问,SQL是首选语言。 Python很重要,但还是败给了Scala和Java,因为这些语言可以帮助数据工程师处理大数据。

总结:数据工程师的主要语言是:SQL,Scala,Java,Python和Lua。

Scala是数据科学中第二重要的语言(而不是R)

当我们查看不同的角色的语言首选时发现了有趣的事,Scala始终处于第二位或第三位。 所以我们可以说数据科学中的排名前三的语言是 Python,SQL和Scala 。 如果您正在考虑学习一门新语言,请考虑使用Scala!

[译] 理想数据科学家的画像是什么样的?

对除数据工程师之外的角色,Spark是首选大数据技能

仅对于数据工程师而言,需要Hadoop的比Spark更多,但总的来说,Spark绝对是首先应该学习的大数据框架。 Cassandra对工程师而言比科学家更重要,而Storm似乎只与数据工程师有关。

总结:数据科学的首选大数据技术是:Spark,Hadoop,Kafka,Hive。

[译] 理想数据科学家的画像是什么样的?

TensorFlow是深度学习的王者

数据工程师职位发布中几乎没有提到深度学习框架,因此该角色似乎不需要这项技能。 提及DL框架最多的是机器学习工程师,表明ML工程师确实大量处理机器学习建模,而不仅仅是模型部署。

此外, TensorFlow在深度学习领域绝对占据主导地位 。尽管Keras作为高级深度学习框架在数据科学家中非常受欢迎,但它几乎与机器学习工程师角色无关,说明可能ML从业者大多使用较低级别的框架,如TensorFlow。

总结:数据科学中最重要的深度学习框架是:TensorFlow,Torch,Caffee和MXNet。

[译] 理想数据科学家的画像是什么样的?

AWS广泛主导

[译] 理想数据科学家的画像是什么样的?

计算机视觉是机器学习最大的需求来源

对于一般的数据科学家来说,自然语言处理是机器学习最大的应用领域,其次是计算机视觉,语音识别,欺诈检测和推荐系统。有趣的是,对于机器学习工程师来说, 需求最大的是计算机视觉 而第二名自然语言处理远在后面。另一方面,数据工程师再次成为聚焦专家--这些ML应用领域中没有一个与他们相关。

洞察力 - 如果您想成为数据科学家,您可以根据想要进入的领域构建各种类型的项目,以展示您的专业知识,但对于机器学习工程师来说,计算机视觉是最佳选择!

[译] 理想数据科学家的画像是什么样的?

对可视化来说,Tableau是必须的

可视化 工具 主要为数据科学家所需,很少在数据工程师和机器学习工程师的职位中提到。但是, Tableau是所有角色的首选 。对于数据科学家来说,Shiny,Matplotlib,ggplot和Seaborn似乎同样重要。

[译] 理想数据科学家的画像是什么样的?

Git对每个人都很重要,而 Docker 仅有工程师需要

[译] 理想数据科学家的画像是什么样的?

接下来,我们使用词云来探索每个角色最常用的关键词,并结合相应的技能为所有数据科学角色构建理想的画像!

数据科学家更多的与机器学习相关,而不是业务或分析

Data Scientist一直被视为需要统计,分析,机器学习和商业知识的全方位知识。 似乎确实如此,或者至少,数据科学家仍被广泛需要。 然而,现在看来,数据科学家们更多与机器学习相关,而不是其他任何事务。

其他主要要求包括:业务,管理,通信,研究,开发,分析,产品,技术,统计,算法,模型,客户/客户和计算机科学。

[译] 理想数据科学家的画像是什么样的?

[译] 理想数据科学家的画像是什么样的?

机器学习工程师是关于研究,系统设计和构建

与一般的数据科学家相比,机器学习工程师肯定似乎有一个更聚焦的技术栈,包括研究,设计和工程。显然,解决方案,产品,软件和系统是主要的。与此同时,有研究,算法,ai,深度学习和计算机视觉。有趣的是,商业,管理,客户和沟通等术语似乎也很重要。这可以在本项目的迭代中进一步研究。另一方面,数据管道和平台也脱颖而出,证实了机器学习工程师在构建数据管道以部署ML系统的责任。

[译] 理想数据科学家的画像是什么样的?

[译] 理想数据科学家的画像是什么样的?

数据工程师是真正的“专”家

与机器学习工程师相比,数据工程师拥有更加聚焦的技术栈。显然他们聚焦的是通过设计和开发管道来支持产品,系统和解决方案。首要要求包括技术技能,数据库,构建,测试,环境和质量。机器学习也很重要,可能是因为管道主要用于支持ML模型部署数据需求。

[译] 理想数据科学家的画像是什么样的?

[译] 理想数据科学家的画像是什么样的?

好了!我希望这个项目可以帮助您了解雇主正在寻找什么样的人,最重要的是帮助您做出如何定制简历和学习哪些技术的明智决策! 

文中图片来自原文,点击 【阅读原文】 可查看英文原文

小编说:

看到数据人才需要这么多能力,可别慌!我们一起好好学习天天向上! 想要了解数据科学人才在TalkingData是如何成长的吗?快戳下方数据公开课吧~

[译] 理想数据科学家的画像是什么样的?


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

精通Spring 4.x

精通Spring 4.x

陈雄华、林开雄、文建国 / 电子工业出版社 / 2017-1-1 / CNY 128.00

Spring 4.0是Spring在积蓄4年后,隆重推出的一个重大升级版本,进一步加强了Spring作为Java领域第一开源平台的翘楚地位。Spring 4.0引入了众多Java开发者翘首以盼的基于Groovy Bean的配置、HTML 5/WebSocket支持等新功能,全面支持Java 8.0,最低要求是Java 6.0。这些新功能实用性强、易用性高,可大幅降低Java应用,特别是Java W......一起来看看 《精通Spring 4.x》 这本书的介绍吧!

Markdown 在线编辑器
Markdown 在线编辑器

Markdown 在线编辑器

RGB CMYK 转换工具
RGB CMYK 转换工具

RGB CMYK 互转工具

HEX HSV 转换工具
HEX HSV 转换工具

HEX HSV 互换工具