Java进阶必备：优雅的告诉面试官消息中间件该如何实现高可用架构？【石杉的架构笔记】

栏目: 后端 · 发布时间: 7年前

内容简介：这篇文章，我们来聊一下消息中间件高可用架构的一些原理。对于一个合格的高级Java工程师而言，你肯定会碰到在系统里用到MQ的场景，那么这个时候你需要基于你的业务场景和需求，考虑在使用MQ的时候可能遇到的一些技术问题。接着，你必须得针对这些技术问题设计一套完整的技术方案。

这篇文章，我们来聊一下消息中间件高可用架构的一些原理。

对于一个合格的高级 Java 工程师而言，你肯定会碰到在系统里用到MQ的场景，那么这个时候你需要基于你的业务场景和需求，考虑在使用MQ的时候可能遇到的一些技术问题。

接着，你必须得针对这些技术问题设计一套完整的技术方案。

你需要从消息的订阅模式、消息的生产到消费全链路不丢数据、消息中间件本身如何保证高可用，等各个角度切入，来考虑好你的系统和MQ对接之后的完整技术方案。

所以，本文就来聊聊消息中间件高可用的架构原理。

（2）先来思考一下消息中间件的可用性问题

咱们先抛开各种具体的技术，就来思考一下，啥是MQ的可用性问题？

大家看看下面的图，其实道理很简单，假如你的MQ就部署在一台机器上，那么正常情况下，生产者都会发送消息到MQ去，然后让消费者获取到。

Java进阶必备：优雅的告诉面试官消息中间件该如何实现高可用架构？【石杉的架构笔记】

但是万一天有不测风云，MQ部署的那台机器，因为一些莫名的原因，MQ自己本身的进程挂掉了，或者是那台机器直接就宕机了，那么此时怎么办呢？

很尴尬，是不是，结果是很明显的，生产者没法发送数据出去，然后消费者也没法获取到数据了。

然后整个系统不就完蛋了？因为系统的核心流程根本无法跑通了，对不对？

MQ宕机就直接导致你的系统本身也故障了，然后可能会导致你的公司对外的APP、网站等产品就无法运作了，用户无法使用你们公司的服务了。

如果你们公司是电商平台、外卖平台、社交平台。那么来这么一出，不是会导致公司损失惨重？

如果你的系统持续几个小时无法被人使用，本来你公司电商平台一天营收可以达到1亿，结果现在导致几个小时内无法下单购买商品，最后当天营收就5000万，那么你的公司是不是直接活生生损失了5000万？

这个真的不是开玩笑的，如果大家留意互联网行业的新闻的话和小道消息的话，就应该知道近几年一些大型互联网公司都出现过类似的情况，损失惨重，咱们做码农的就得被祭天了是不是？

（3）集群化部署 + 数据多副本冗余

好，问题来了！现在你感觉一个MQ中间件应该如何实现高可用呢？

这里的方式有很多种，比如说数据多副本冗余，集群镜像同步机制，我们就抛开具体的技术来从本质层面思考一下MQ集群实现高可用的几种方式。

先来看下面的一张图，假设我们写到MQ的数据都被多副本冗余了，也就是你写的每一条消息都被复制到了其他的机器上去了。

那么此时任何一台机器宕机，似乎都不会影响我们跟MQ继续通信，而且写出去的数据似乎也都还在。

Java进阶必备：优雅的告诉面试官消息中间件该如何实现高可用架构？【石杉的架构笔记】

上面的图里，MQ采用集群模式部署到了2台机器上去，然后生产者给其中一台机器写入一条消息，该机器自动同步复制给另外一台机器。

此时数据在2台机器上，就有2个副本了，那么如果第一台机器宕机了，会影响我们吗？

答案是：不会。

因为数据本身是多副本冗余的，此时消费者完全可以从第二台机器消费到这条消息，并且生产者还可以继续给第二台机器写入消息，数据没丢失。

而且，系统根本不用中断流程，还可以继续运行，我们看下面的图。

Java进阶必备：优雅的告诉面试官消息中间件该如何实现高可用架构？【石杉的架构笔记】

这种感觉是不是很棒？实际上这种MQ集群化部署架构以及数据多副本冗余机制，是非常常见的一种高可用架构。

Kafka这个极为优秀的消息中间件，就是采用的这种架构保证高可用、数据容错性。

（4）多副本同步复制强制要求

但是这里你要思考另外几个问题，第一个就是：你在写数据到其中一台机器的时候，是不是得要求，必须得让那台机器复制数据到另外一台机器了，保证集群里一定有这条数据双副本了，才可以认为本次写成功了？

没错，假如你要是不能保证这一点，比如你就写数据给了其中一台机器，然后他还没来得及复制给另外一台机器呢，直接第一台机器就宕机了。

此时虽然你可以继续基于第二台机器发送消息和消费消息，但是你刚才发送的一条消息就丢失了。

大家看下面的图来理解一下这个场景。

Java进阶必备：优雅的告诉面试官消息中间件该如何实现高可用架构？【石杉的架构笔记】

所以对于采用这种机制的时候，你必须得让生产者通过一些参数的设置，保证说写一条消息到某台机器，他必须同步这条消息到另外一台机器成功，集群里有双副本了，然后此时才可以认为这条消息写成功了。

但凡刚写一台机器他就宕机，还没来得及复制到另外一台机器的话，本次写应该报错失败，然后你应该重试再次写入数据到MQ集群里去。

大家看看下面的图。只要你一次写成功了，他就保证肯定已经同步数据为双副本了，此时哪怕一台机器宕机，数据不会丢失，生产和消费都可以有条不紊的继续进行。

Java进阶必备：优雅的告诉面试官消息中间件该如何实现高可用架构？【石杉的架构笔记】

（5）多机器承载多副本强制要求

第二个问题，假如说现在你的集群中本来有两台机器，现在宕机了其中的一台，只有一台机器了，你还能允许你的生产者对唯一的一台机器继续写入数据吗？

答案是：否。

因为如果集群里只有一台机器可以承载写入，那么万一剩余的一台机器又宕机了呢？是不是还是会导致数据丢失，集群完蛋？

所以说，你的生产者同理应该基于参数设置一下，集群里必须有超过2台机器可以接收你的数据副本复制。

否则如果只有1台机器可以接受你的数据副本复制的话，那么还是算了。

大家看看下面的图，感受一下那个场景。

Java进阶必备：优雅的告诉面试官消息中间件该如何实现高可用架构？【石杉的架构笔记】

假设集群里有3台机器，那么其中一台宕机了，你后续再写入另外一台的时候，判断一下集群里还有剩余两台机器，足以保证数据双副本的高可用性和容错性，所以可以继续正常的写入数据到MQ集群里去。

实际上，上面说的那一整套的机制，在Kafka里都可以采用，他有对应的一些参数可以配置数据有几个副本，包括你每次写入必须复制到几台机器才可以算成功，否则就要重新发送，以及你的集群剩余机器必须可以承载几个副本才能继续写入数据。

通过这一整套方案的设计和基于具体技术的落地，才可以保证在集群化部署的情况下，集群必须有几台机器承载多副本，同时数据写入之后必须是保证多副本冗余的。

此时，任何机器宕机，数据都不会丢失，还可以正常让系统继续运行。

（6）架构原理与技术无关性

其实本文对消息中间件的集群高可用架构的探讨，是完全脱离于某个具体技术的，非常朴素的从本质的原理层面来讨论这个话题。

具体的RabbitMQ、Kafka、RocketMQ等各种不同的消息中间件，对这种高可用架构的实现，都有一定的相似想通性，但是也都有各自不同的技术实现，以及相对应的区别。

后面我们再通过不同的文章，以各种MQ中间件的具体技术实现举例来讨论一下相关的架构是如何落地的。

END

如有收获，请帮忙转发，您的鼓励是作者最大的动力，谢谢！

一大波微服务、分布式、高并发、高可用的原创系列文章正在路上

欢迎扫描下方二维码，持续关注：

Java进阶必备：优雅的告诉面试官消息中间件该如何实现高可用架构？【石杉的架构笔记】

石杉的架构笔记（id:shishan100）

十余年BAT架构经验倾囊相授

推荐阅读：

1、拜托！面试请不要再问我Spring Cloud底层原理

2、【双11狂欢的背后】微服务注册中心如何承载大型系统的千万级访问？

3、【性能优化之道】每秒上万并发下的Spring Cloud参数优化实战

4、微服务架构如何保障双11狂欢下的99.99%高可用

5、兄弟，用大白话告诉你小白都能听懂的Hadoop架构原理

6、大规模集群下Hadoop NameNode如何承载每秒上千次的高并发访问

7、【性能优化的秘密】Hadoop如何将TB级大文件的上传性能优化上百倍

8、拜托，面试请不要再问我TCC分布式事务的实现原理！

9、【坑爹呀！】最终一致性分布式事务如何保障实际生产中99.99%高可用？

10、拜托，面试请不要再问我 Redis 分布式锁的实现原理！

11、【眼前一亮！】看Hadoop底层算法如何优雅的将大规模集群性能提升10倍以上？

12、亿级流量系统架构之如何支撑百亿级数据的存储与计算

13、亿级流量系统架构之如何设计高容错分布式计算系统

14、亿级流量系统架构之如何设计承载百亿流量的高性能架构

15、亿级流量系统架构之如何设计每秒十万查询的高并发架构

16、亿级流量系统架构之如何设计全链路99.99%高可用架构

17、七张图彻底讲清楚ZooKeeper分布式锁的实现原理

18、大白话聊聊Java并发面试问题之volatile到底是什么？

19、大白话聊聊Java并发面试问题之Java 8如何优化CAS性能？

20、大白话聊聊Java并发面试问题之谈谈你对AQS的理解？

21、大白话聊聊Java并发面试问题之公平锁与非公平锁是啥？

22、大白话聊聊Java并发面试问题之微服务注册中心的读写锁优化

23、互联网公司的面试官是如何360°无死角考察候选人的？（上篇）

24、互联网公司面试官是如何360°无死角考察候选人的？（下篇）

25、 Java进阶面试系列之一：哥们，你们的系统架构中为什么要引入消息中间件？

26、【Java进阶面试系列之二】：哥们，那你说说系统架构引入消息中间件有什么缺点？

27、【行走的Offer收割机】记一位朋友斩获BAT技术专家Offer的面试经历

28、【Java进阶面试系列之三】哥们，消息中间件在你们项目里是如何落地的？

29、【Java进阶面试系列之四】扎心！线上服务宕机时，如何保证数据100%不丢失？

30、一次JVM FullGC的背后，竟隐藏着惊心动魄的线上生产事故！

31、【高并发优化实践】10倍请求压力来袭，你的系统会被击垮吗？

32、【Java进阶面试系列之五】消息中间件集群崩溃，如何保证百万生产数据不丢失？

33、亿级流量系统架构之如何在上万并发场景下设计可扩展架构（上）？

34、亿级流量系统架构之如何在上万并发场景下设计可扩展架构（中）？

35、亿级流量系统架构之如何在上万并发场景下设计可扩展架构（下）？

36、亿级流量架构第二弹：你的系统真的无懈可击吗？

37、亿级流量系统架构之如何保证百亿流量下的数据一致性（上）

38、亿级流量系统架构之如何保证百亿流量下的数据一致性（中）？

39、亿级流量系统架构之如何保证百亿流量下的数据一致性（下）？

40、互联网面试必杀：如何保证消息中间件全链路数据100%不丢失（1）

41、互联网面试必杀：如何保证消息中间件全链路数据100%不丢失（2 ）

42、面试大杀器：消息中间件如何实现消费吞吐量的百倍优化？

43、高并发场景下，如何保证生产者投递到消息中间件的消息不丢失？

44、兄弟，用大白话给你讲小白都能看懂的分布式系统容错架构

45、从团队自研的百万并发中间件系统的内核设计看Java并发性能优化

46、【非广告，纯干货】英语差的程序员如何才能无障碍阅读官方文档？

47、如果20万用户同时访问一个热点缓存，如何优化你的缓存架构？

作者：石杉的架构笔记链接： juejin.im/post/5c263a… 来源：掘金著作权归作者所有，转载请联系作者获得授权！

以上就是本文的全部内容，希望本文的内容对大家的学习或者工作能带来一定的帮助，也希望大家多多支持码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络，本站转载出于传递更多信息之目的，版权归原作者或者来源机构所有，如转载稿涉及版权问题，请联系我们。

UCD火花集

UCD火花集

UCDChina / 人民邮电出版社 / 2009 / 25.00元

本书收集了UCDChina上线以来推出的13个话题，内容涵盖了产品设计的全部流程，按顺序集结到第一到第十三章中，讨论了如何研究用户、如何将用户需求应用到产品设计中、如何传达和协作。在第十四章，几位设计师分享了生活中的UE故事。第十五章，列举了一些实例和实践者的观点。本书适合有一定工作经验，从事产品设计、产品策划、交互设计、视觉设计、用户研究、前端开发、网站运营，以及所有与互联网有关的从业人员阅读。一起来看看《UCD火花集》这本书的介绍吧!

JSON 在线解析

JSON 在线解析

在线 JSON 格式化工具

RGB转16进制工具

RGB转16进制工具

RGB HEX 互转工具

RGB CMYK 转换工具

RGB CMYK 转换工具

RGB CMYK 互转工具

版权所有，保留一切权利！© 2018-2026 码农网粤ICP备17054400号-3