mysql-使用联合索引

栏目: 数据库 · 发布时间: 7年前

内容简介：项目使用mysql数据库，某张表数据量2000W左右，比较大，在组合查询时发生超时，需要优化。查询优化常用方法就是建立索引查询语句样例：查询在20181001-20181010时间范围内A=a且B=b的数据

背景

项目使用 mysql 数据库，某张表数据量2000W左右，比较大，在组合查询时发生超时，需要优化。

优化

查询优化常用方法就是建立索引

查询语句样例：查询在20181001-20181010时间范围内A=a且B=b的数据

select * from table where A = 'a' and B = 'b' and Date > '20181001' and Date < '20181010'

按照查询建立了一个组合索引 idx_query(A, B, Date)，查询仍然报超时。然后开始研究索引原理，最后更改索引中列的顺序为idx_query(B,A,Date)解决。

---------------------------------------------------------------------------------------------

上面只是简单的使用情况，下面从原理细细解读索引

索引原理

首先，出问题以后再建立索引，是一种不好的习惯。排查、定位、解决问题会耗费很多开发时间和精力。

当然，不充分思考就给大多数列建立单列索引，给所有查询建立联合索引，是一种更坏的习惯。毕竟删除索引风险远高于添加索引。

使用索引需要成本：

空间成本：索引是占空间的，大表的联合索引占用空间不可忽略
时间成本：使用不对的索引会浪费时间
更新成本：增删改操作只要跟索引有关系，就需要更新索引

索引适合在返回大表中很小一部分数据时使用，很小当然越小越好，5%以下还可以，1%以下更好，如果表的数据量非常大，千万级别，返回行数要小道0.1%以下

从很大表中用联合条件查询出很小的数据，等价于count(distinct 联合条件) 的值很大，这个值被称为Cardinality，索引适合度=Cardinality/表记录数。

索引误区

多个单列索引(如idx_A, idx_B)不等同于联合索引(idx_A_B)

两个联合索引里的列顺序不同，这两个联合索引也不等价，适用场景不同

联合索引idx_A_B能够覆盖的场景

A = ？ and B = ？
A = ？ and B in (?, ?, ?)
A = ?
A in (?,?,?)

覆盖场景可以根据索引存储结构(B+Tree)推导出。

上面罗列的集中覆盖场景，效率由上至下越来越低，因为扫描行数越来越大

联合条件中，最左侧的索引列很重要，最好使用Cardinality最大的列。

总结

项目中遇到的问题，最终根据索引原理中最左侧索引列使用Cardinality最大列解决。

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络，本站转载出于传递更多信息之目的，版权归原作者或者来源机构所有，如转载稿涉及版权问题，请联系我们。

码农书籍

社交红利2.0

徐志斌 / 中信出版社 / 2015-9 / 42元

大型社交网络发展至今，开始显露出更为惊人的力量。有一个独特现象与这一结果相伴相生，即新应用或服务一进入社交网络就即时引爆，就像用户在等待它出现一样。随即开始的病毒式扩散，让创业者成为全民话题的焦点。但这一切是如何实现的？具备哪些特征的合作伙伴才可以被即时引爆？作者从其长期追踪的近30个一进入微博、微信就引爆的经典案例中甄选出若干典型案例。从大量一手鲜活的后台数据入手，并结合腾讯对社交网络的......一起来看看《社交红利2.0》这本书的介绍吧!

码农工具

mysql-使用联合索引

背景

优化

索引原理

索引误区

联合索引idx_A_B能够覆盖的场景

总结

社交红利2.0

HTML 压缩/解压工具

RGB转16进制工具

在线进制转换器