内容简介:下面开始今天的学习~
点击上方 蓝字 关注我们
下面开始今天的学习~
下面是腾讯的两则招聘:
(1)算法工程师
(2)数据挖掘工程师
总体而言,机器学习和数据挖掘类职位主要考察两方面的知识:
-
机器学习和数据挖掘的理论知识
-
编程开发和数据结构算法的基础
对于已有工作经验的同学,还要加上业务理解能力。
我们利用以上三个维度,将应聘者大概分为 10 类,下面我们看下各位同学都适合哪些岗位和发展方向。
▼ 图片来源: 36 大数据
-
A 类 : 在机器学习和数据挖掘的理论知识方面有很深的造诣 :
主要是负责做最顶尖机器学习相关学术研究。比如创造一些新的算法,例如早期的 SVM,LDA 以及最近的一些深度学习模型。但是处在塔尖的的他们对于这些算法在业务场景的应用或者算法的实现兴趣并不大,主要精力都花在了理论研究上。主要成果发表在顶会或者顶期上。他们主要存在于一些研究机构中,如国外高校或者企业研究院。一般企业如果需要这样的人,也是挖过来当镇厂之宝,不属于我们讨论的范围。
-
B 类 : 既对算法有比较深入的了解,又有高超的编程技术 :
这类同学对算法有深刻的理解,但可能没有达到创造新算法的层次,这类同学的数学水平可能也达不到炉火纯青的地步。他们的兴趣不在于各种繁琐的理论推导,而是在于对已有算法进行改进,并且给出最好的实现,造福广大人民群众,例如 LIBSVM,SVDFeature,paramater server 这样的工具。当然,这样的人才也是可遇不可求,而且他们也需要一个比较大的平台来施展自己的能力。他们的工作应该能够成为一个企业数据挖掘的大杀器。
-
C 类 : 对算法有一定的了解,但是不够深入,开发的经验有限 :
很多理论方向的研究生博士生可能就处于这个状态,即使能够发表一些看起来不错的文章,但离真正做出好的实际的数据挖掘工作还有很长的一段距离,需要一步一个脚印的踏实前进。但以目前的情况,去不错的大企业工作也是很容易的。
-
D 类 : 码农中的翘楚,横扫各路 ACM、ICPC 比赛的英雄 :
虽然他们对于机器学习理论和数据挖掘的应用场景不是很了解,但凭借他们强大的编程能力,在应用开发方面无人能及,适用于任何需要落地的场景。
-
E 类 : 属于一般的码农,能写一手好代码,但是对机器学习知之甚少 :
这种情况的同学,如果希望成为一名算法工程师,那么需要花费比较多的时间在理论基础上,要能够沉得下心去推公式,总之,还是有一段路要走。
-
F 类 : 工作贴近业务,对数据也有一定敏感性,可能是 excel 和 sql 的高手 :
但是这和数据挖掘的工作还有一定差别。最适合他们的岗位可能是 BI 或者数据产品经理。在这些岗位上,他们同样可以发光发热,做出卓越的贡献。
-
G 类 : 他们有一定的算法基础,同时对数据挖掘的业务落地也有丰富的经验,瓶颈主要在于编程开发能力 :
这在大数据的场景下尤为明显。毕竟最好的方式是自己想 idea,自己实现,至少实现一个原型。那么 R 或者 Python 是一个很好的选择。没有 coding 能力,再好的算法也出不来。同时又不能像理论大牛对理论基础有很深刻的理解和研究。这种情况非常被动,只能努力提高自己的编程能力。
-
H 类 : 对机器学习算法有一定的了解,熟悉各种业务,也有一定的开发能力 。
在数据挖掘的具体工作中,可以从业务出发,设计算法,也能对算法进行基本的实现。实际上这样的工程师还是很多的,特别是有一定工作经验的。他们的工作经验会对数据挖掘的工作起到很大的帮助。他们在算法以及编程的上的能力可能不是很高,但是足以丰富他们的思维方式,也方便与人沟通。
-
I 类 : 对机器学习算法有一定了解,也有较强的开发能力 。
这类同学适合做偏向开发的数据挖掘岗位。他们很可能是学校的应届毕业生,学习了一些理论知识,也锻炼了开发的能力,但还缺乏实际的工作经验。互联网的数据挖掘岗位正是他们大展拳脚的好地方。
-
J 类 : 各项技能都很全面,也很适合做 Leader 。
但是这样的人毕竟可遇不可求。另外,每一项都好其实也就是每一项都不好,人的精力总是有限的。在一到两个方面做的比较突出,同时另外的方面也不要太弱以至于成为短板,这样就挺好的了。
各位同学目前分别是哪种类型,并希望自己成为哪种类型呢?总体而言,如果是希望以后做科研的同学,就把精力主要放在理论上即可,编程语言使用高效的 Python 以及 Matlab,能够快速实现自己的想法。希望成为企业中的算法工程师的同学,要在对算法的理解上以及开发能力上,提升自我。最后,如果是希望做开发的同学,主要需要提升自己的开发能力。
在实际招聘过程中,对于大多数一般的有一定经验的 程序员 或者应届毕业生。除了基本的代码能力外,以下几个方面通常是算法工程师考察的重点:
-
机器学习算法的理解,比如常见算法的基本思想原理、应用场景、特点和求解方法 。 可以从两个分支考察,一个是使用经验,比如实际的调参经验,使用技巧,面向 H 类。还有就是一些算法的实现方法,面向 I 类。
-
实际的项目经验,特别是数据挖掘工作 。一方面考察他之前的工作情况,另外也看他的归纳总结能力与解决问题的能力。针对项目的一些细节提问,也可以看出他的做事方式和对一些知识的掌握情况。
-
对于业务的理解能力和敏感性 ,可以结合实际工作中的一些问题来考察。即使没有实际工作经验,也是可以看出他们在这个方面的潜力。同时也考察出理论和实际结合的能力。
-
沟通表达能力 。相对于纯开发的程序员,数据挖掘岗位对这个能力的要求高出不少。在整个面试的过程中,其实都有对这个能力的考察。
本文作者:宋娜
编辑&版式:霍霍
声明:本文归 “力扣” 版权所有,如需转载请联系。
文中部分图片来源于网络,为非商业用途使用,如有侵权联系删除。
推荐阅读
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网
猜你喜欢:- 数据挖掘竞赛指南:曾经的数据挖掘少年,如今的阿里算法大佬
- 数据挖掘实操:用文本挖掘剖析近 5 万首《全唐诗》
- 数据挖掘复习笔记---02.数据
- Python之数据挖掘
- 趋势分析之数据挖掘
- python 数据挖掘算法简要
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。