分库分表后的索引问题

栏目: IT技术 · 发布时间: 6年前

内容简介：最近遇到一个慢sql，在排查过程中发现和分库分表后的索引设置有关系，总结了下问题。在进行应用健康度盘点时，发现有个慢sql 如下表结构,

摘要

最近遇到一个慢sql，在排查过程中发现和分库分表后的索引设置有关系，总结了下问题。

问题

在进行应用健康度盘点时，发现有个慢sql 如下

表结构, 按照userid进行的分表 。

explain 一下发现走的是userid这个索引，一个用户下面有很多商品，也就有了很多brandgoodid，所以有可能会很慢，因为要扫描很多的索引键去过滤brandgoodid值。而写这个 SQL 的人期望走的主键索引，而不是'userid'的索引。因为用主键索引，就是N次主键扫描（N表示in中的数量）。

分析

直接原因很明显

IN 这个查询误导了 mysql 的优化器，选错了索引 IN 查询常常会影响mysql server的判断。主要是IN里面的值数量不同，会影响扫描行数的不同，所以常常会出现索引选择不一致。之前也总结过一篇SQL IN 一定走索引吗

解决

因为用户查询的brandgoodlid是限定在某个group维度下的，一个group对应的brandgood是有限的，在这个业务中，通常小于10。所以这个地方使用主键索引，效率更高。解决方法也就是这地方需要 force index 强制走PRIMARY index。

扩展

分库分表后的索引

为什么题目叫分库分表后的索引问题的，直接原因和分库分表并没有什么关系啊？因为在排查问题时，犯了一个错误。以为路由到具体的brandgood_0020表后，可以直接根据brandgoodid主键索引来查询了。认为和一些分布式数据库(cassandra)一样,是clustering key+partition key这种索引数据。可以根据clustering key到数据的节点的partition块，然后根据local index 找到对应的数据。

但其实mysql的分库分表不一样，分表键不是索引，只是客户端路由。只负责找到对应的表。到表以后，就是和单表一样查询逻辑。

因为分表键不是索引，但是查询语句是必须要带着分表键，那意味着我们的分库分表以后的表索引大部分要建成联合索引了， 分表键+索引键 。

要不然我们的查询语句 select xx from table where 分表键=xxx AND a =xxx，是走不了联合索引的。只能走单索引。单索引mysql server要面临着索引选择的问题。

当然并不是绝对的，比如上面我举的那个案例。按照这个思路查看了下其他的分表索引。果然表上的大部分索引都是非联合索引，还是直接从单表copy过来的索引。这些索引基本上都是无用的，因为都的是userid索引.

索引选择的问题

mysql为什么会选错索引呢，详细的请看10 | MySQL为什么有时候会选错索引

我们这个案例是因为判断扫描行数的时候出问题了。

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络，本站转载出于传递更多信息之目的，版权归原作者或者来源机构所有，如转载稿涉及版权问题，请联系我们。

码农书籍

C程序设计

谭浩强 / 清华大学出版社 / 2005-7-1 / 26.00元

《C程序设计(第3版)》作者具有丰富的教学经验和编写教材的经验，并针对初学者的特点，精心策划、准确定位，使得《C程序设计(第3版)》概念清晰、例题丰富、深入浅出，受到专家和读者的一致好评。《C程序设计(第3版)》被普遍认为是学习C语言的好教材，并被全国大多数高校选用。十多年来《C程序设计(第3版)》累计发行了800多万册，刨同类书的全国最高记录，是学习C语言的主流用书。《C程序设计(第3版)》曾荣......一起来看看《C程序设计》这本书的介绍吧!

码农工具