内容简介:本文是TalkingData University翻译自George Liu 发表在towardsdatascience的一篇文章。在昨天的推送中,
本文是TalkingData University翻译自George Liu 发表在towardsdatascience的一篇文章。
在昨天的推送中, George 给出了不同角色数据人才能力画像,本文是他通过分析Indeed网站的招聘信息进一步分析得到的结果。 点 击 【阅读原文】 可查看英文原文。
感兴趣的同学,还可发送关键词 “ 数据人才报告” 至本公众号,看看报告中TDU和美世咨询如何定义数据人才的不同角色及能力集。
如果您是数据科学方向的求职者,您一定想知道在您的简历添加哪些技能可以让您接到面试电话;如 果您想进入这个 领域,您可能想破脑袋想知道学习哪些技能才能成为更有吸引力的候选人。
来吧,我有你想要的答案。
首先,我们来看看不同岗位的技能要求。
R与 Python 之争已经结束,因为Python现在是主导者
曾经有人争论过到底Python和R谁才是数据科学的首选语言。显然,市场需求告诉我们 Python现在是领导者 。同样值得注意的是,R甚至比SAS更少提到。因此,如果您正在考虑进入数据科学领域,请考虑将您的学习重点放在Python上。 SQL作为数据库的语言(也可能是数据!),是数据科学家第二重要的语言。由于数据科学家职业的广泛性,其他语言也扮演着重要角色。
总结:数据科学家的主要语言是:Python,SQL,Scala,Lua,Java,SAS,R,C ++和Matlab。
机器学习工程师所需的语言更加多样化
作为机器学习的实际语言, Python 当选机器学习工程师的 首选语言 并不令人惊讶。而从头开始实现算法,并在大数据环境中部署ML模型,使得C ++和Scala等相关语言也很重要。总的来说,与其他两个角色相比,机器学习工程师对编程语言的需求似乎更加分散。
总结:机器学习工程师的主要语言是:Python,Scala,Java,C ++,Lua,SQL,Javascript,Matlab,CSS和C#。
如果你想成为一名数据工程师,SQL绝对是必备的
数据工程师始终在处理数据库,SQL是数据库语言,所以毫无疑问,SQL是首选语言。 Python很重要,但还是败给了Scala和Java,因为这些语言可以帮助数据工程师处理大数据。
总结:数据工程师的主要语言是:SQL,Scala,Java,Python和Lua。
Scala是数据科学中第二重要的语言(而不是R)
当我们查看不同的角色的语言首选时发现了有趣的事,Scala始终处于第二位或第三位。 所以我们可以说数据科学中的排名前三的语言是 Python,SQL和Scala 。 如果您正在考虑学习一门新语言,请考虑使用Scala!
对除数据工程师之外的角色,Spark是首选大数据技能
仅对于数据工程师而言,需要Hadoop的比Spark更多,但总的来说,Spark绝对是首先应该学习的大数据框架。 Cassandra对工程师而言比科学家更重要,而Storm似乎只与数据工程师有关。
总结:数据科学的首选大数据技术是:Spark,Hadoop,Kafka,Hive。
TensorFlow是深度学习的王者
数据工程师职位发布中几乎没有提到深度学习框架,因此该角色似乎不需要这项技能。 提及DL框架最多的是机器学习工程师,表明ML工程师确实大量处理机器学习建模,而不仅仅是模型部署。
此外, TensorFlow在深度学习领域绝对占据主导地位 。尽管Keras作为高级深度学习框架在数据科学家中非常受欢迎,但它几乎与机器学习工程师角色无关,说明可能ML从业者大多使用较低级别的框架,如TensorFlow。
总结:数据科学中最重要的深度学习框架是:TensorFlow,Torch,Caffee和MXNet。
AWS广泛主导
计算机视觉是机器学习最大的需求来源
对于一般的数据科学家来说,自然语言处理是机器学习最大的应用领域,其次是计算机视觉,语音识别,欺诈检测和推荐系统。有趣的是,对于机器学习工程师来说, 需求最大的是计算机视觉 , 而第二名自然语言处理远在后面。另一方面,数据工程师再次成为聚焦专家--这些ML应用领域中没有一个与他们相关。
洞察力 - 如果您想成为数据科学家,您可以根据想要进入的领域构建各种类型的项目,以展示您的专业知识,但对于机器学习工程师来说,计算机视觉是最佳选择!
对可视化来说,Tableau是必须的
可视化 工具 主要为数据科学家所需,很少在数据工程师和机器学习工程师的职位中提到。但是, Tableau是所有角色的首选 。对于数据科学家来说,Shiny,Matplotlib,ggplot和Seaborn似乎同样重要。
Git对每个人都很重要,而 Docker 仅有工程师需要
接下来,我们使用词云来探索每个角色最常用的关键词,并结合相应的技能为所有数据科学角色构建理想的画像!
数据科学家更多的与机器学习相关,而不是业务或分析
Data Scientist一直被视为需要统计,分析,机器学习和商业知识的全方位知识。 似乎确实如此,或者至少,数据科学家仍被广泛需要。 然而,现在看来,数据科学家们更多与机器学习相关,而不是其他任何事务。
其他主要要求包括:业务,管理,通信,研究,开发,分析,产品,技术,统计,算法,模型,客户/客户和计算机科学。
机器学习工程师是关于研究,系统设计和构建
与一般的数据科学家相比,机器学习工程师肯定似乎有一个更聚焦的技术栈,包括研究,设计和工程。显然,解决方案,产品,软件和系统是主要的。与此同时,有研究,算法,ai,深度学习和计算机视觉。有趣的是,商业,管理,客户和沟通等术语似乎也很重要。这可以在本项目的迭代中进一步研究。另一方面,数据管道和平台也脱颖而出,证实了机器学习工程师在构建数据管道以部署ML系统的责任。
数据工程师是真正的“专”家
与机器学习工程师相比,数据工程师拥有更加聚焦的技术栈。显然他们聚焦的是通过设计和开发管道来支持产品,系统和解决方案。首要要求包括技术技能,数据库,构建,测试,环境和质量。机器学习也很重要,可能是因为管道主要用于支持ML模型部署数据需求。
好了!我希望这个项目可以帮助您了解雇主正在寻找什么样的人,最重要的是帮助您做出如何定制简历和学习哪些技术的明智决策!
文中图片来自原文,点击 【阅读原文】 可查看英文原文
小编说:
看到数据人才需要这么多能力,可别慌!我们一起好好学习天天向上! 想要了解数据科学人才在TalkingData是如何成长的吗?快戳下方数据公开课吧~
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网
猜你喜欢:本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
精通Spring 4.x
陈雄华、林开雄、文建国 / 电子工业出版社 / 2017-1-1 / CNY 128.00
Spring 4.0是Spring在积蓄4年后,隆重推出的一个重大升级版本,进一步加强了Spring作为Java领域第一开源平台的翘楚地位。Spring 4.0引入了众多Java开发者翘首以盼的基于Groovy Bean的配置、HTML 5/WebSocket支持等新功能,全面支持Java 8.0,最低要求是Java 6.0。这些新功能实用性强、易用性高,可大幅降低Java应用,特别是Java W......一起来看看 《精通Spring 4.x》 这本书的介绍吧!