内容简介:《设计数据密集型应用(影印版)Designing data-intensive applications》,中文版是《数据密集型应用系统设计》。这本书9月份就由中国电力出版社出版了。因为我习惯在互动出版网浏览新书,而它没有跟中国电力出版社合作,所以最近才发现。此外,还想引用一下书中 Alan Kay 的一段话(接受美国Dr. Dobb 杂志采访,2012)

《设计数据密集型应用(影印版)Designing data-intensive applications》,中文版是《数据密集型应用系统设计》。




于是静候。又怕落到不靠谱的译者手里,所以想试着翻译一点,选了第9章,主要是因为这章偏理论,此外还有一段关于CAP理论(定理)的评价。译了三四天,进展太慢,到 “图 9-4” 就搁置(放弃)了。我是先把PDF转成纯文本,然后粘到 Google 翻译,之后再修订。Google 翻译的质量很高了,但有一些比较绕的句子,也不太容易修订通顺。还有就是一些名词,Google 翻译也能比较准确的翻译一些名词,当然还是有需要修订的。比如 Linearizability,会被翻译为 线性化 ,我则译为 线性一致性 ; Leader 都译为主节点;Quorum 是一个比较头疼的词,译成 法定人数 太长了,又没有找到两三个字的词。



另外放上 DDIA 的第9章原文

此外,还想引用一下书中 Alan Kay 的一段话(接受美国Dr. Dobb 杂志采访,2012)


第9章 一致性和共识


—— Jay Kreps, 关于Kafka 和Jepsen的若干说明 (2013)


我们将在本章讨论一些示例算法和协议,来构建容错的分布式系统。我们将假定第8章中的所有故障都有可能发生: 数据包可能丢失、乱序、重复或在网络上延迟任意时间; 时钟是近似的; 节点可以在任意时刻停顿 (例如,发生了内存垃圾收集) 或崩溃。

构建容错系统最好的方法是找到一些可以提供若干有用保证(Guarantee)的通用抽象。一旦实现了这些抽象,就可以基于其上构建应用程序,获得相应的保证。这与我们在第7章中关于事务的思路相同: 通过使用事务,应用程序可以假装没有崩溃 (原子性),没有其他人同时访问数据库 (隔离),并且存储设备是绝对可靠的 (持久性)。即使发生了崩溃、竞态条件和磁盘故障,事务抽象也会屏蔽这些问题,应用程序无需操心。

现在我们沿着这个思路,寻求能够让应用程序忽略分布式系统中某些故障的抽象。例如,分布式系统中最重要的抽象之一是 共识(Consensus) :即让所有的节点都达成一致意见。我们将在本章发现,在网络故障及进程故障的情况下,可靠地达成共识是非常棘手的。



我们需要了解哪些事情是可行的,哪些是不可行的: 某些情况下,系统可以容忍故障并继续工作; 在其它情况下则是不可能的。理论和实践已经深入探索了可能和不可能的界限。我们将在本章概述这些根本限制。

这些主题已经在分布式系统领域研究了几十年,因此有很多资料 —— 我们只能介绍一点皮毛。本书无法详细介绍形式模型和证明的细节,我们将采用非正式的直观介绍。如果你感兴趣,参考文献提供了大量的深入内容。



大多数多副本数据库至少都提供了 最终一致性 (Eventual consistency)。这意味着,如果你停止数据库写入操作并等待一段不确定的时间,那么最终所有读请求都会返回相同的值[1]。换句话说,不一致是暂时的,最终会自行化解(假设网络中的任何故障最终都会修复)。将最终一致性称为 收敛性 (Convergence)可能更合适,因为我们预料所有的副本最终会收敛到相同的值[2]。

然而,这是一个非常弱的保证 —— 它没有说 什么时候 副本将收敛。在收敛之前,读操作可能会返回任何值或空值[1]。例如,如果你写了一个值,然后立即再次读取,则不能保证你能看到刚写入的值,因为读取可能会被转发到不同的副本(请参阅第5章的“写后读Reading Your Own Writes”,第152页 )。






  • 我们首先介绍通常用到的最强的一致性模型,线性一致性(Linearizability),并讨论其优缺点。
  • 然后,我们将讨论分布式系统中事件顺序的问题(“顺序保证”,第319页),特别是关于因果序和全序的问题。
  • 在第三部分(“分布式事务和共识”,第352页),我们将探讨如何原子的提交分布式事务,这将最终引导我们找到共识问题的解决方案。



这就是 线性一致性 (linearizability)[6]的想法(也称为 原子一致性 (atomic consistency)[7], 强一致性 (strong consistency), 即时一致性 (immediate consistency)或 外部一致性 (external consistency)[8])。线性一致性的准确定义涉及很多细节,我们将用这一小节来探讨。但基本的想法是让系统看起来好像只有一个数据副本,并且其上的所有操作都是原子的。有了这个保证,尽管实际上可能有多个副本,应用程序也不需要操心它们。

在可线性化的系统中,只要客户端成功完成写入,所有从数据库进行读取的客户端必须能够看到刚写入的值。保持数据单一副本的假象意味着保证读取到的值是最新的值,不是来自陈旧的缓存或副本。换句话说,线性一致性是对 新近性 (recency)的保证。为了说明情况,我们来看一个非线性一致系统的例子。

<图 9-1.> 非线性一致的系统,导致了球迷的困惑



什么使系统可线性化? What Makes a System Linearizable?




被称为寄存器(register) —— 实际上,它可以是键值存储中的一个键,关系数据库中的一行或文档数据库中的一个文档。

<图 9-2.> 如果读取请求与写入请求是并发的,那么旧值或新值都可能被返回。

简单起见,图9-2仅显示了来自客户端的请求,不考虑数据库。每段横条都是客户端发出的请求,首端是发出请求的时间,末端是客户端收到响应的时间。由于不定的网络延迟,客户端无法确定数据库何时处理其请求 —— 只知道必定是从发出请求到接收响应这段时间之内处理的。(脚注:图中一个微妙的细节是,假定存在着一个以水平轴表示的全局时钟。尽管真实系统通常没有准确的时钟(请参阅第8章“不可靠的时钟”,第287页),但这种假设是可行的:为了分析分布式算法,我们可以假设存在精确的全局时钟,只要算法不使用它即可[47]。算法只能看到由石英晶振和NTP产生的近似值。)


  • 表示客户端请求读取寄存器 的值,数据库返回值
  • 表示客户端请求将寄存器 赋值为 ,数据库返回响应 (可以是正常或错误)。


的初始值为 0,客户端C向其写入1。在写入过程中,客户端A和B反复轮询数据库以读取最新值。A和B可能读到哪些值呢?

  • 客户端A的第一个读取操作在C写入开始之前就完成了,因此必须返回旧值0。
  • 客户端A最后的读操作在C写入完成后才开始,所以如果数据库是线性一致的,它肯定必须返回新的值1:我们知道具体的写入必然是在对应请求的开始与结束之间的某个时刻进行处理的,同样具体的读取必然是在对应请求的开始与结束之间的某个时刻进行处理。如果在写入结束后才开始读取,则读取的处理必然晚于写入,因此必须要读到已经写入的新值。
  • 与写操作有时间重叠的读操作可能会返回0或1,因为我们不知道写操作在处理读操作时是否已经生效。读和写是并发的。

但是,这还不足以完全描述线性一致性:如果与写操作并发的读操作可能会返回旧值或新值,那么在写操作进行过程中,读进程也可能会看到这个值在旧值和新值之间反复变动。这不是我们所期望的所谓等效于“单一数据副本”的系统。(脚注:与写操作并发读取时可能返回旧值或新值的寄存器称为 常规寄存器 (regular register)[7, 25]。)


<图 9-3.> 在任一次读取到新值后,任意客户端的后续所有读取也必须返回该新值。


的值原子的从 0 变成 1。因此,如果一个客户端的读取返回新值1,即使写入操作尚未结束(响应尚未返回到对应的客户端),所有后续的读取也必须返回新值。

图9-3中用箭头表示这种时序依赖。客户端A是第一个读到新值1的。在A的读取返回之后,B开始新的读取。由于B的读取严格在A读取之后发生,因此即使C的写入仍在进行中,数据库也必须返回1。(与图9-1中Alice和Bob的情况相同:在Alice读取新值之后,Bob也希望读取到新值 。)



  • 表示客户端请求原子的 比较并置位 操作(请参阅第7章“比较并置位”,第245页)。如果寄存器 的当前值等于 ,则原子地将其值置为 。如果 ,则不改变寄存器的值,并返回错误。 是数据库的响应(正常或错误)。



<图 9-4.> 标出读取和写入生效的时刻。B最后的那次读取的是非线性一致的。

应用线性一致性 Relying on Linearizability

分布式锁和主节点选举 Locking and leader election

约束和唯一性保证 Constraints and uniqueness guarantees

跨信道的时序依赖 Cross-channel timing dependencies

实现线性一致的系统 Implementing Linearizable Systems

线性一致性和 Quorums Linearizability and quorums

线性一致性的成本 The Cost of Linearizability

CAP理论 The CAP theorem

以下是 Google 翻译的内容( https://translate.google.cn/ 没有被墙,可以正常访问)








The Unhelpful CAP Theorem

CAP is sometimes presented as Consistency, Availability, Partition tolerance: pick 2 out of 3. Unfortunately, putting it this way is misleading[32] because network partitions are a kind of fault, so they aren’t something about which you have a choice: they will happen whether you like it or not [38].

At times when the network is working correctly, a system can provide both consistency (linearizability) and total availability. When a network fault occurs, you have to choose between either linearizability or total availability. Thus, a better way of phrasing CAP would be either Consistent or Available when Partitioned [39]. A more reliable network needs to make this choice less often, but at some point the choice is inevitable.

In discussions of CAP there are several contradictory definitions of the term availability, and the formalization as a theorem [30] does not match its usual meaning [40]. Many so-called “highly available” (fault-tolerant) systems actually do not meet CAP’s idiosyncratic definition of availability. All in all, there is a lot of misunderstanding and confusion around CAP, and it does not help us understand systems better, so CAP is best avoided.

The CAP theorem as formally defined [30] is of very narrow scope: it only considers one consistency model (namely linearizability) and one kind of fault (network partitions, or nodes that are alive but disconnected from each other). It doesn’t say anything about network delays, dead nodes, or other trade-offs. Thus, although CAP has been historically influential, it has little practical value for designing systems [9, 40].

There are many more interesting impossibility results in distributed systems [41], and CAP has now been superseded by more precise results [2, 42], so it is of mostly historical interest today.

线性一致性和网络延迟 Linearizability and network delays



以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网






