作者 | 中华石杉
责编 | 伍杏玲
本文经授权转载自石杉的架构笔记
这篇文章,给大家分享一个同学面试阿里某个部门时的经历。
简单说一下这个同学面试的背景,本身技术底子还不错,在几个有一定知名度的中型互联网公司工作过,然后之前打算尝试一下阿里的职位,就去面试了。
第一轮和第二轮面试,全部都通过了,面试官评价也是基本技术素养还可以,基础也不错,定级都是P6+的职级。
但是第三面是那个部门老大P9出来面试他,结果就挂在这里了 ,所以把这个第三面的一些问题分享出来,给大家参考。
业务背景介绍
这个同学上来先阐述了一下自己的一些项目经历,当前他在公司里主要是负责一个数据类的系统,业务逻辑并不复杂,但是有一点技术难度。
主要是每天都会有人调用他的接口,然后有数据会落入数据库表中。
简化一下来说,大概是这个背景,如下图:
这个系统每天接口调用大概会落入数据库中有20万左右的数据量,那么每个月大概是600万左右的数据量,每年大概是近亿级的数据量会落入数据库中。
但是这是针对整个数据库来说的,平摊到里面核心的每个表,大概每个表每年新增个千万级别的数据量。
架构演进考察
面试官:
现在系统压力其实不大,每天20万新增数据量也不大,每年哪怕单表新增千万级数据其实也还算可以接受。
第一个问题:如果假设你的系统承载的业务量翻了10倍,每天新增200万数据,你的系统架构要如何演进?
如果系统承载的业务量翻了100倍,每天新增2000万数据,你的系统架构要如何演进?
候选人:
我们还没这种需求,所以我暂时还没想过这个问题。
建议:
实际上这类问题在BAT、美团、京东等大公司里面试,都是常问的,为什么呢?
因为大公司里的系统面对的就是业务经常翻倍的增长,系统压力越来越大,所以每年都要做几次技术升级,一直要进行架构演进。
所以在互联网公司里,架构设计能力中非常关键的一环,就是针对业务增长,架构演进的能力是非常核心的。
你要有一个意识说如果你的业务量10倍增长,100倍增长,你的系统架构要如何演进?这几乎是资深工程师必须要有的一个意识和能力。
其实大家可以思考一下,如果10倍增长,单表每年新增近亿数据,还能用单库单表的方式来承载吗?
肯定不行了,所以必然针对10倍增长的场景,需要引入分库分表的技术,保证每个库每个表分散一定的数据量,避免单表单库数据量过大。
那么大家再思考一下,如果100倍增长呢,每年单表新增近10亿数据,你分库分表也不一定够了。因为此时可能会有高并发访问的问题,数据库抗起来很吃力。
此时,你要不要考虑数据异构、冷热分离等数据存储的架构设计?
比如采用 MySQL 分库分表 + 分布式NoSQL数据库 + Elasticsearch分布式搜索 + Redis缓存的架构,来整体设计这个数据存储架构。
先做冷热分离的架构,比如最热的数据放入分布式NoSQL数据库,专门承载当日数据的高并发写入,以及高性能的读写。
然后每过一段时间,做数据归档,把NoSQL里不再频繁使用的冷数据迁移到MySQL里去归档。
最后就是应对海量数据的检索,可以把索引构建在Elasticsearch里来应对,但是从NoSQL+MySQL的异构存储来提取明细数据即可。
而且针对一些特别热查询的数据,可以依托 Redis 做一个缓存。
其实那个P9面试官的面试评价里,期望的也是候选人把这一套架构说出来。虽然P6+的职级不一定说有能力完全hold住这个架构,但是起码要有这个意识。
结果候选人完全什么都说不出来,那当然会让人很失望了。
对公司底层技术的原理考察
这位同学他们的系统有一部分的数据是放在特殊存储服务里的,用的是云平台上的存储服务,而且存放在存储服务里的数据还是很核心的数据。
所以面试官就开始问第二个问题了。
面试官:
你能说说你对这种特殊存储服务的理解吗,原理是什么?
你们用的云平台上的服务存储他的架构是什么样的,你们的存储是如何规划的?
候选人:
我一般是调用API往里面写数据,详细的还没太多关注过。
建议:
这是该同学犯的第二个错误,不说资深工程师,就说作为一个高级工程师,应该对自己负责的系统使用到的方方面面都有一定的了解。
比如你要是用了语音转换API,或者是快递公司的查询API,那你起码知道人家背后大致在干什么,或者问清楚人家API的QPS极限,以及访问量是多少。
你们用了特殊的存储服务,起码知道那种存储服务的实现原理是什么,存储的容量规划等等问题,这是一个高级工程师hold住自己工作的起码工作素养。
系统难点的考察
面试气氛尴尬,不过仍然继续。
面试官:
那你觉得这个系统最大的技术难点是什么?
候选人:
我想想(思索10秒后),好像没什么难的,主要就是一些接口,然后数据就落入数据库了。
建议:
大公司面试一定会问你系统的难点是什么,这代表你的项目经验有多少含金量。
哪怕你们项目很Low,平时也得想办法弄点新技术进去,没难点也要凑点儿难点出来,否则去面试必然给人鄙视。
举个例子,比如上面的这个系统,实际上他有一个步骤是要做数据迁移,也就是说把数据库里可能几百万数据量,一次性迁移到另外一套存储里去
那么这个数据迁移的步骤,其实涉及到千万级的数据量迁移。
你如何保证数据迁移的效率?如何保证迁移后的数据准确性?在迁移的过程中如何避免影响数据库的性能?
像这些问题,其实你平时都应该考虑一下,作为一个技术难点好好阐述一下吧。
擅长技术的考察
面试官:
那你说说你认为自己最擅长最有深度的技术吧?
候选人:
我好像平时自己用MQ技术比较多一些。
面试官:
那你说说Kafka、RabbitMQ、RocketMQ几种MQ的对比,还有他们各自的原理。
它们分别如何实现分布式消息队列架构的,底层的机制都聊一下,对比一下特点以及优缺点。
建议:
大公司一定会考察你的技术深度,一般就是对你平时用的最多,或者最熟悉的技术深入挖掘和考察,看你的技术深度有多深。
结果这个同学自己说了MQ,但是对MQ的了解实际上非常的浅薄,深入的东西都说不出来,那么最后一定就是让面试官很无语了。
总结
其实这个同学技术底子还是不错的,包括一些技术的基础,所以前两轮面试都是过了的。但是第三轮面试考察的角度都是完全不同的,一下子暴露出来了他的能力缺陷。
对自己负责系统的架构演进完全无意识,负责系统的难点从没思考过,系统涉及的一些技术的细节不了解,没有技术深度的积累,都导致他在三面表现很不好,最后就是直接挂掉。
所以希望大家通过这篇文章,吸取这位同学的经验教训,平时多思考自己负责系统的技术难点,以及业务量成倍增长时架构如何演进,系统涉及到的各种技术的细节,以及积累相关技术的技术深度。
作者简介:中华石杉,十余年BAT架构经验,倾囊相授
公众号:石杉的架构笔记(id:shishan100)
【END】
作为码一代,想教码二代却无从下手:
听说少儿编程很火,可它有哪些好处呢?
孩子多大开始学习比较好呢?又该如何学习呢?
最新的编程教育政策又有哪些呢?
下面给大家介绍CSDN新成员: 极客宝宝(ID: geek_baby)
戳他了解更多↓↓↓
热 文推 荐
☞ 她说:为啥 程序员 都特想要机械键盘?这答案我服!
System.out.println("点个在看吧!"); console.log("点个在看吧!"); print("点个在看吧!"); printf("点个在看吧!\n"); cout << "点个在看吧!" << endl; Console.WriteLine("点个在看吧!"); Response.Write("点个在看吧!"); alert("点个在看吧!") echo "点个在看吧!"
你点的每个“在看”,我都认真当成了喜欢
以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网
猜你喜欢:- 互联网公司面试官是如何360°无死角考察候选人的?(下篇)【石杉的架构笔记】
- 我用一个小小的开放设计题,干掉了 40% 的面试候选人
- 一上台就紧张?这个模型帮你生成演讲「替身」,肢体语言比总统候选人还丰富
- 讲清楚分布式系统中的这个算法,帮你从面试候选人中脱颖而出!
- 一篇补齐你的Web安全知识死角
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。