[译] 理想数据科学家的画像是什么样的?

栏目: 数据库 · 发布时间: 6年前

内容简介:本文是TalkingData University翻译自George Liu 发表在towardsdatascience的一篇文章。在昨天的推送中,

本文是TalkingData University翻译自George Liu 发表在towardsdatascience的一篇文章。

在昨天的推送中, George 给出了不同角色数据人才能力画像,本文是他通过分析Indeed网站的招聘信息进一步分析得到的结果。 【阅读原文】 可查看英文原文。

感兴趣的同学,还可发送关键词  数据人才报告”  至本公众号,看看报告中TDU和美世咨询如何定义数据人才的不同角色及能力集。

前篇: 数据科学职业全景导航 【点击阅读】

如果您是数据科学方向的求职者,您一定想知道在您的简历添加哪些技能可以让您接到面试电话;如 果您想进入这个 领域,您可能想破脑袋想知道学习哪些技能才能成为更有吸引力的候选人。

来吧,我有你想要的答案。

首先,我们来看看不同岗位的技能要求。

R与 Python 之争已经结束,因为Python现在是主导者

曾经有人争论过到底Python和R谁才是数据科学的首选语言。显然,市场需求告诉我们 Python现在是领导者 。同样值得注意的是,R甚至比SAS更少提到。因此,如果您正在考虑进入数据科学领域,请考虑将您的学习重点放在Python上。 SQL作为数据库的语言(也可能是数据!),是数据科学家第二重要的语言。由于数据科学家职业的广泛性,其他语言也扮演着重要角色。

总结:数据科学家的主要语言是:Python,SQL,Scala,Lua,Java,SAS,R,C ++和Matlab。

机器学习工程师所需的语言更加多样化

作为机器学习的实际语言, Python 当选机器学习工程师的 首选语言 并不令人惊讶。而从头开始实现算法,并在大数据环境中部署ML模型,使得C ++和Scala等相关语言也很重要。总的来说,与其他两个角色相比,机器学习工程师对编程语言的需求似乎更加分散。

总结:机器学习工程师的主要语言是:Python,Scala,Java,C ++,Lua,SQL,Javascript,Matlab,CSS和C#。

如果你想成为一名数据工程师,SQL绝对是必备的

数据工程师始终在处理数据库,SQL是数据库语言,所以毫无疑问,SQL是首选语言。 Python很重要,但还是败给了Scala和Java,因为这些语言可以帮助数据工程师处理大数据。

总结:数据工程师的主要语言是:SQL,Scala,Java,Python和Lua。

Scala是数据科学中第二重要的语言(而不是R)

当我们查看不同的角色的语言首选时发现了有趣的事,Scala始终处于第二位或第三位。 所以我们可以说数据科学中的排名前三的语言是 Python,SQL和Scala 。 如果您正在考虑学习一门新语言,请考虑使用Scala!

[译] 理想数据科学家的画像是什么样的?

对除数据工程师之外的角色,Spark是首选大数据技能

仅对于数据工程师而言,需要Hadoop的比Spark更多,但总的来说,Spark绝对是首先应该学习的大数据框架。 Cassandra对工程师而言比科学家更重要,而Storm似乎只与数据工程师有关。

总结:数据科学的首选大数据技术是:Spark,Hadoop,Kafka,Hive。

[译] 理想数据科学家的画像是什么样的?

TensorFlow是深度学习的王者

数据工程师职位发布中几乎没有提到深度学习框架,因此该角色似乎不需要这项技能。 提及DL框架最多的是机器学习工程师,表明ML工程师确实大量处理机器学习建模,而不仅仅是模型部署。

此外, TensorFlow在深度学习领域绝对占据主导地位 。尽管Keras作为高级深度学习框架在数据科学家中非常受欢迎,但它几乎与机器学习工程师角色无关,说明可能ML从业者大多使用较低级别的框架,如TensorFlow。

总结:数据科学中最重要的深度学习框架是:TensorFlow,Torch,Caffee和MXNet。

[译] 理想数据科学家的画像是什么样的?

AWS广泛主导

[译] 理想数据科学家的画像是什么样的?

计算机视觉是机器学习最大的需求来源

对于一般的数据科学家来说,自然语言处理是机器学习最大的应用领域,其次是计算机视觉,语音识别,欺诈检测和推荐系统。有趣的是,对于机器学习工程师来说, 需求最大的是计算机视觉 而第二名自然语言处理远在后面。另一方面,数据工程师再次成为聚焦专家--这些ML应用领域中没有一个与他们相关。

洞察力 - 如果您想成为数据科学家,您可以根据想要进入的领域构建各种类型的项目,以展示您的专业知识,但对于机器学习工程师来说,计算机视觉是最佳选择!

[译] 理想数据科学家的画像是什么样的?

对可视化来说,Tableau是必须的

可视化 工具 主要为数据科学家所需,很少在数据工程师和机器学习工程师的职位中提到。但是, Tableau是所有角色的首选 。对于数据科学家来说,Shiny,Matplotlib,ggplot和Seaborn似乎同样重要。

[译] 理想数据科学家的画像是什么样的?

Git对每个人都很重要,而 Docker 仅有工程师需要

[译] 理想数据科学家的画像是什么样的?

接下来,我们使用词云来探索每个角色最常用的关键词,并结合相应的技能为所有数据科学角色构建理想的画像!

数据科学家更多的与机器学习相关,而不是业务或分析

Data Scientist一直被视为需要统计,分析,机器学习和商业知识的全方位知识。 似乎确实如此,或者至少,数据科学家仍被广泛需要。 然而,现在看来,数据科学家们更多与机器学习相关,而不是其他任何事务。

其他主要要求包括:业务,管理,通信,研究,开发,分析,产品,技术,统计,算法,模型,客户/客户和计算机科学。

[译] 理想数据科学家的画像是什么样的?

[译] 理想数据科学家的画像是什么样的?

机器学习工程师是关于研究,系统设计和构建

与一般的数据科学家相比,机器学习工程师肯定似乎有一个更聚焦的技术栈,包括研究,设计和工程。显然,解决方案,产品,软件和系统是主要的。与此同时,有研究,算法,ai,深度学习和计算机视觉。有趣的是,商业,管理,客户和沟通等术语似乎也很重要。这可以在本项目的迭代中进一步研究。另一方面,数据管道和平台也脱颖而出,证实了机器学习工程师在构建数据管道以部署ML系统的责任。

[译] 理想数据科学家的画像是什么样的?

[译] 理想数据科学家的画像是什么样的?

数据工程师是真正的“专”家

与机器学习工程师相比,数据工程师拥有更加聚焦的技术栈。显然他们聚焦的是通过设计和开发管道来支持产品,系统和解决方案。首要要求包括技术技能,数据库,构建,测试,环境和质量。机器学习也很重要,可能是因为管道主要用于支持ML模型部署数据需求。

[译] 理想数据科学家的画像是什么样的?

[译] 理想数据科学家的画像是什么样的?

好了!我希望这个项目可以帮助您了解雇主正在寻找什么样的人,最重要的是帮助您做出如何定制简历和学习哪些技术的明智决策! 

文中图片来自原文,点击 【阅读原文】 可查看英文原文

小编说:

看到数据人才需要这么多能力,可别慌!我们一起好好学习天天向上! 想要了解数据科学人才在TalkingData是如何成长的吗?快戳下方数据公开课吧~

[译] 理想数据科学家的画像是什么样的?


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

艾伦•图灵传

艾伦•图灵传

(英)安德鲁·霍奇斯 / 孙天齐 / 湖南科学技术出版社 / 2012-8-1 / 68.00元

《艾伦·图灵传:如谜的解谜者》是图灵诞辰100周年纪念版,印制工艺更为精美。本书是世界共认的最权威的图灵传记。艾伦?图灵是现代人工智能的鼻祖,在24岁时奠定了计算机的理论基础。二战期间,他为盟军破译密码,为结束战争做出巨大贡献。战后,他开创性地提出人工智能的概念,并做了大量的前期工作。因同性恋问题事发,被迫注射激素,后来吃毒苹果而死。作者是一名数学家,也是一名同性恋者。他对图灵的生平有切身的体会,......一起来看看 《艾伦•图灵传》 这本书的介绍吧!

图片转BASE64编码
图片转BASE64编码

在线图片转Base64编码工具

MD5 加密
MD5 加密

MD5 加密工具

HEX HSV 转换工具
HEX HSV 转换工具

HEX HSV 互换工具