ES 集群上，业务数量级越来越大如何优化

栏目: 后端 · 发布时间: 6年前

内容简介：ES 的安装下载，网上一大片，我这边不在重复。可以看看我以前做的小笔记：其中 ES 三大要素：文档，在面向对象观念就是一个对象。在 ES 里面，是一个大 JSON 对象，是指定了唯一 ID 的最底层或者根对象。文档的位置由 index、type 和 _id 唯一标识。文档元数据：

一、ES 基础

ES 的安装下载，网上一大片，我这边不在重复。可以看看我以前做的小笔记：

https://www.bysocket.com/?p=1997

其中 ES 三大要素：

文档（Document）

文档，在面向对象观念就是一个对象。在 ES 里面，是一个大 JSON 对象，是指定了唯一 ID 的最底层或者根对象。文档的位置由 index、type 和 _id 唯一标识。文档元数据：

索引（Index）

索引，用于区分文档成组，即分到一组的文档集合。索引，用于存储文档和使文档可被搜索。比如项目索引命名为 project ，交易索引命名为 trade 等。

类型（Type）

类型，用于区分索引中的文档，即在索引中对数据逻辑分区。比如设计项目分为 ui 、 ux 这些类型。可以放在该类目进行区分。但一般操作，很少用到这么复杂的。

可见， _index 索引的重要性。避免某个索引存储不相关的数据。

二、ES 集群

ES 集群搭建，文章很多。我这边也不一一列举了。先看 ES 集群分布式图

ES 集群上，业务数量级越来越大如何优化

集群（Cluster）

跟服务器集群类似，多个 ElasticSearch 运行实例（节点 Node）的组合构成完整的 ElasticSearch 集群。

ElasticSearch 是天然分布式的，可以通过水平扩容为集群添加更多节点。

ElasticSearch 集群是去中心化的，只有一个主节点（Master）。而且主节点是动态选举，因此不会出现单点故障。

节点（Node）

上面说过，一个 ElasticSearch 实例就是节点。任何节点都可以被选举成为主节点。主节点负责集群内所以变更，比如文档的增加、删除等。所以集群不会因为主节点流量的增大成为瓶颈。因为任何节点都会成为主节点。

如上图，P1 P2 P0 是节点内的主分片，其他 R 是副分片。

分片（Shard）

分片，是 ES 节点中最小的工作单元。分片仅保存全部数据的一部分。分片包括主分片和副分片，主分片是副分片的拷贝。主分片和副分片基本没有大的区别。

如果是全文搜索，会查询到每个分片，然后将每个分片的结果进行全局地收集，并处理返回。

举个例子：比如新建了一个索引 project , 存储项目相关的数据。那具体的某个 project A 的数据会被切分，存储在不同的分片上。那么根据 project A 的 _id 如何路由到具体的分片上呢？

分片的路由公式是这样的：

shard = hash(routing) % numberofprimary_shards

三、ES 集群上业务优化

一个索引 project , 存储某业务的数据。其数量级越来越大，比如说商品数量，订单量，逐渐成为亿量级，万亿量级。那一个大索引的查询就会出现性能瓶颈。这时候我们该如何优化呢？

这时候是不是想到了，一句常说的:空间换时间。这时候是不是也想到了，MySQL 分库分表方案。

拆字诀:类似分片的路由规则，根据具体业务指定即可。

这里，我们可以定义 1000 个索引，分别名为 project1、project2、project_3...

然后在 ES 集群上面架一层简单的 proxy 。里面核心的业务路由规则可以这样:

indexid = projectid % 1000

一图胜千言

ES 集群上，业务数量级越来越大如何优化

机械设计实践

村洋太郎(日) / 王启义/等 / 机械工业出版社 / 1998-08 / 36.00

本书记述了各种设计过程的思考方法和具体作法以及必要的知识和具体数据。介绍了设计中要决定的内容和相应的制约条件。如功能、机构、构造、形状、力和强度、尺寸加工工艺、工具、材料、机械要素等。最后介绍了具体设计实例。本书的目的在于即使不看其他的书和参考书就能设计出所需要的具体机械。本书供从事机械设计的有关技术人员及大专院校相关专业的师生使用。一起来看看《机械设计实践》这本书的介绍吧!

码农工具

ES 集群上，业务数量级越来越大如何优化

一、ES 基础

文档（Document）

索引（Index）

类型（Type）

二、ES 集群

集群（Cluster）

ElasticSearch 是天然分布式的，可以通过水平扩容为集群添加更多节点。

ElasticSearch 集群是去中心化的，只有一个主节点（Master）。而且主节点是动态选举，因此不会出现单点故障。

节点（Node）

分片（Shard）

三、ES 集群上业务优化

推荐阅读

机械设计实践

HTML 压缩/解压工具

HTML 编码/解码

HSV CMYK 转换工具