内容简介:索引用于快速找出在某个列中有一特定值的行,不使用索引,MySQL必须从第一条记录开始读完整个表,直到找出相关的行,表越大,查询数据所花费的时间就越多,如果表中查询的列有一个索引,MySQL能够快速到达一个位置去搜索数据文件,而不必查看所有数据,那么将会节省很大一部分时间。例如:有一张person表,其中有2W条记录,记录着2W个人的信息。有一个Phone的字段记录每个人的电话号码,现在想要查询出电话号码为xxxx的人的信息。如果没有索引,那么将从表中第一条记录一条条往下遍历,直到找到该条信息为止。
索引用于快速找出在某个列中有一特定值的行,不使用索引,MySQL必须从第一条记录开始读完整个表,直到找出相关的行,表越大,查询数据所花费的时间就越多,如果表中查询的列有一个索引,MySQL能够快速到达一个位置去搜索数据文件,而不必查看所有数据,那么将会节省很大一部分时间。
例如:有一张person表,其中有2W条记录,记录着2W个人的信息。有一个Phone的字段记录每个人的电话号码,现在想要查询出电话号码为xxxx的人的信息。
如果没有索引,那么将从表中第一条记录一条条往下遍历,直到找到该条信息为止。
如果有了索引,那么会将该Phone字段,通过一定的方法进行存储,好让查询该字段上的信息时,能够快速找到对应的数据,而不必在遍历2W条数据了。其中 MySQL 中的索引的存储类型有两种:BTREE、HASH。
也就是用树或者Hash值来存储该字段,要知道其中详细是如何查找的,就需要会算法的知识了。我们现在只需要知道索引的作用,功能是什么就行。
二、MySQL中索引的优点和缺点和使用原则
优点:
- 所有的MySql列类型(字段类型)都可以被索引,也就是可以给任意字段设置索引
- 大大加快数据的查询速度
缺点:
- 创建索引和维护索引要耗费时间,并且随着数据量的增加所耗费的时间也会增加
- 索引也需要占空间,我们知道数据表中的数据也会有最大上线设置的,如果我们有大量的索引,索引文件可能会比数据文件更快达到上线值
- 当对表中的数据进行增加、删除、修改时,索引也需要动态的维护,降低了数据的维护速度。
使用原则:
通过上面说的优点和缺点,我们应该可以知道,并不是每个字段度设置索引就好,也不是索引越多越好,而是需要自己合理的使用。
- 对经常更新的表就避免对其进行过多的索引,对经常用于查询的字段应该创建索引,
- 数据量小的表最好不要使用索引,因为由于数据较少,可能查询全部数据花费的时间比遍历索引的时间还要短,索引就可能不会产生优化效果。
- 在一同值少的列上(字段上)不要建立索引,比如在学生表的"性别"字段上只有男,女两个不同值。相反的,在一个字段上不同值较多可是建立索引。 上面说的只是很片面的一些东西,索引肯定还有很多别的优点或者缺点,还有使用原则,先基本上理解索引,然后等以后真正用到了,就会慢慢知道别的作用。注意,学习这张,很重要的一点就是必须先得知道索引是什么,索引是干嘛的,有什么作用,为什么要索引等等,如果不知道,就重复往上面看看写的文字,好好理解一下。一个表中很够创建多个索引,这些索引度会被存放到一个索引文件中(专门存放索引的地方)
三、索引的分类
注意:索引是在存储引擎中实现的,也就是说不同的存储引擎,会使用不同的索引
MyISAM和InnoDB存储引擎:只支持BTREE索引, 也就是说默认使用BTREE,不能够更换
MEMORY/HEAP存储引擎:支持HASH和BTREE索引
索引我们分为四类来讲
单列索引(普通索引,唯一索引,主键索引)、组合索引、全文索引、空间索引
单列索引:
一个索引只包含单个列,但一个表中可以有多个单列索引。 这里不要搞混淆了。
- 普通索引: MySQL中基本索引类型,没有什么限制,允许在定义索引的列中插入重复值和空值,纯粹为了查询数据更快一点。
- 唯一索引: 索引列中的值必须是唯一的,但是允许为空值,
- 主键索引: 是一种特殊的唯一索引,不允许有空值。
组合索引
在表中的多个字段组合上创建的索引,只有在查询条件中使用了这些字段的左边字段时,索引才会被使用,使用组合索引时遵循最左前缀集合。这个如果还不明白,等后面举例讲解时在细说
全文索引
全文索引,只有在MyISAM引擎上才能使用,只能在CHAR,VARCHAR,TEXT类型字段上使用全文索引,介绍了要求,说说什么是全文索引,就是在一堆文字中,通过其中的某个关键字等,就能找到该字段所属的记录行,比如有"好人,二货 ..."
通过好人,可能就可以找到该条记录。这里说的是可能,因为全文索引的使用涉及了很多细节,我们只需要知道这个大概意思,如果感兴趣进一步深入使用它,那么看下面测试该索引时,会给出一个博文,供大家参考。
空间索引
空间索引是对空间数据类型的字段建立的索引,MySQL中的空间数据类型有四种,GEOMETRY、POINT、LINESTRING、POLYGON。在创建空间索引时,使用SPATIAL关键字。要求,引擎为MyISAM,创建空间索引的列,必须将其声明为NOT NULL。具体细节看下面
四、索引操作(创建和删除)
创建索引
- 创建表的时候创建索引
格式:CREATE TABLE 表名[字段名 数据类型] [UNIQUE|FULLTEXT|SPATIAL|...] [INDEX|KEY] [索引名字] (字段名[length]) [ASC|DESC]
|--------------------------------------| |-----------------------------------| |------------| |---------| |---------------| |------------|
普通创建表语句 设置什么样的索引(唯一、全文等) 索引关键字 索引名字 对哪个字段设置索引 对索引进行排序
- 创建普通索引
CREATE TABLE book ( bookid INT NOT NULL, bookname VARCHAR(255) NOT NULL, authors VARCHAR(255) NOT NULL, info VARCHAR(255) NULL, comment VARCHAR(255) NULL, year_publication YEAR NOT NULL, INDEX(year_publication) ) CREATE TABLE book ( bookid INT NOT NULL, bookname VARCHAR(255) NOT NULL, authors VARCHAR(255) NOT NULL, info VARCHAR(255) NULL, comment VARCHAR(255) NULL, year_publication YEAR NOT NULL, KEY(year_publication) ) 复制代码
上面两种方式创建度可以,通过这个例子可以对比一下格式,就差不多明白格式是什么意思了。
通过打印结果,我们在创建索引时没写索引名的话,会自动帮我们用字段名当作索引名。 测试:看是否使用了索引进行查询。
SELECT * FROM book WHERE year_publication = 1990\G; 复制代码
解释:虽然表中没数据,但是有EXPLAIN关键字,用来查看索引是否正在被使用,并且输出其使用的索引的信息。
id:SELECT识别符。这是SELECT的查询序列号,也就是一条语句中,该select是第几次出现 。在次语句中,select就只有一个,所以是1. select_type:所使用的SELECT查询类型,SIMPLE表示为简单的SELECT,不实用UNION或子 查询,就为简单的SELECT。也就是说在该SELECT查询时会使用索引。其他取值, PRIMARY:最外面的SELECT.在拥有子查询时,就会出现两个以上的SELECT。UNION:union (两张表连接)中的第二个或后面的select语句 SUBQUERY:在子查询中,第二SELECT。 table:数据表的名字。他们按被读取的先后顺序排列,这里因为只查询一张表,所以只 显示book type: 指定本据表和其他数据表之间的关联关系,该表中所有符合检索值的记录都会被取 出来和从上一个表中取出来的记录作联合。ref用于连接程序使用键的最左前缀或者是该 键不是 primary key 或unique索引(换句话说,就是连接程序无法根据键值只取得一条 记录)的情况。当根据键值只查询到少数几条匹配的记录时,这就是一个不错的连接类型 。(注意,个人这里不是很理解,百度了很多资料,全是大白话,等以后用到了这类信息 时,在回过头来补充,这里不懂对后面的影响不大。)可能的取值有 system、const、eq_ref、index和All possible_keys:MySQL在搜索数据记录时可以选用的各个索引,该表中就只有一个索引,y ear_publication key:实际选用的索引 key_len:显示了mysql使用索引的长度(也就是使用的索引个数),当key字段的值为null 时,索引的长度就是null。注意,key_len的值可以告诉你在联合索引中mysql会真正使用 了哪些索引。这里就使用了1个索引,所以为1, ref:给出关联关系中另一个数据表中数据列的名字。常量(const),这里使用的是1990 ,就是常量。 rows:MySQL在执行这个查询时预计会从这个数据表里读出的数据行的个数。 extra:提供了与关联操作有关的信息,没有则什么都不写。 上面的一大堆东西能看懂多少看多少,我们最主要的是看possible_keys和key 这两个属性,上面显示了key为year_publication。说明使用了索引。 复制代码
- 创建唯一索引
CREATE TABLE t1 ( id INT NOT NULL, name CHAR(30) NOT NULL, UNIQUE INDEX UniqIdx(id) ) 复制代码
解释:对id字段使用了索引,并且索引名字为UniqIdx。
SHOW CREATE TABLE t1\G; 复制代码
要查看其中查询时使用的索引,必须先往表中插入数据,然后在查询数据,不然查找一个没有的id值,是不会使用索引的。
INSERT INTO t1 VALUES(1,'xxx'); EXPLAIN SELECT * FROM t1 WHERE id = 1\G; 复制代码
可以看到,通过id查询时,会使用唯一索引。并且还实验了查询一个没有的id值,则不会使用索引,我觉得原因是所有的id应该会存储到一个const tables中,到其中并没有该id值,那么就没有查找的必要了。
- 创建主键索引
CREATE TABLE t2 ( id INT NOT NULL, name CHAR(10), PRIMARY KEY(id) ); INSERT INTO t2 VALUES(1,'QQQ'); EXPLAIN SELECT * FROM t2 WHERE id = 1\G; 复制代码
通过这个主键索引,我们就应该反应过来,其实我们以前声明的主键约束,就是一个主键索引,只是之前我们没学过,不知道而已。
- 创建单列索引
这个其实就不用在说了,前面几个就是单列索引。
*创建组合索引
组合索引就是在多个字段上创建一个索引
创建一个表t3,在表中的id、name和age字段上建立组合索引
CREATE TABLE t3 ( id INT NOT NULL, name CHAR(30) NOT NULL, age INT NOT NULL, info VARCHAR(255), INDEX MultiIdx(id,name,age) ); SHOW CREATE t3\G; 复制代码
解释最左前缀
组合索引就是遵从了最左前缀,利用索引中最左边的列集来匹配行,这样的列集称为最左前缀,不明白没关系,举几个例子就明白了,例如,这里由id、name和age3个字段构成的索引,索引行中就按id/name/age的顺序存放,索引可以索引下面字段组合(id,name,age)、(id,name)或者(id)。如果要查询的字段不构成索引最左面的前缀,那么就不会是用索引,比如,age或者(name,age)组合就不会使用索引查询
在t3表中,查询id和name字段
EXPLAIN SELECT * FROM t3 WHERE id = 1 AND name = 'joe'\G; 复制代码
在t3表中,查询(age,name)字段,这样就不会使用索引查询。来看看结果
EXPLAIN SELECT * FROM t3 WHERE age = 3 AND name = 'bob'\G; 复制代码
- 创建全文索引
全文索引可以用于全文搜索,但只有MyISAM存储引擎支持FULLTEXT索引,并且只为CHAR、VARCHAR和TEXT列服务。索引总是对整个列进行,不支持前缀索引,
CREATE TABLE t4 ( id INT NOT NULL, name CHAR(30) NOT NULL, age INT NOT NULL, info VARCHAR(255), FULLTEXT INDEX FullTxtIdx(info) )ENGINE=MyISAM; SHOW CREATE TABLE t4\G; 复制代码
使用一下什么叫做全文搜索。就是在很多文字中,通过关键字就能够找到该记录。
INSERT INTO t4 VALUES (8,'AAA',3,'text is so good,hei,my name is bob') ,(9,'BBB',4,'my name is gorlr'); SELECT * FROM t4 WHERE MATCH(info) AGAINST('gorlr'); 复制代码
EXPLAIN SELECT * FROM t4 WHERE MATCH(info) AGAINST('gorlr'); 复制代码注意:在使用全文搜索时,需要借助MATCH函数,并且其全文搜索的限制比较多,比如只能通过MyISAM引擎,比如只能在CHAR,VARCHAR,TEXT上设置全文索引。比如搜索的关键字默认至少要4个字符,比如搜索的关键字太短就会被忽略掉。等等,如果你们在实验的时候可能会实验不出来。感兴趣的同学可以看看这篇文章,全文搜索的使用
- 创建空间索引
空间索引也必须使用MyISAM引擎, 并且空间类型的字段必须为非空。
这个空间索引具体能干嘛我也不知道,可能跟游戏开发有关,可能跟别的东西有关,等遇到了自然就知道了,现在只要求能够创建出来。
CREATE TABLE t5 ( g GEOMETRY NOT NULL, SPATIAL INDEX spatIdx(g) ) ENGINE = MyISAM; SHOW CREATE TABLE t5\G; 复制代码
- 在已经存在的表上创建索引
格式:ALTER TABLE 表名 ADD[UNIQUE|FULLTEXT|SPATIAL] [INDEX|KEY] [索引名] (索引字段名)[ASC|DESC] 有了上面的基础,这里就不用过多陈述了。
命令一:
SHOW INDEX FROM 表名\G 复制代码
查看一张表中所创建的索引
SHOW INDEX FROM book\G; 复制代码
挑重点讲,我们需要了解的就5个,用红颜色标记了的,如果想深入了解,可以去查查该方面的资料,我个人觉得,这些等以后实际工作中遇到了在做详细的了解把。
Table:创建索引的表 Non_unique:表示索引非唯一,1代表非唯一索引,0代表唯一索引,意思就是该索引是不是唯一索引 Key_name:索引名称 Seq_in_index :表示该字段在索引中的位置,单列索引的话该值为1,组合索引为每个字段在索引定义中的顺序(这个只需要知道单列索引该值就为1,组合索引为别的) Column_name:表示定义索引的列字段 Sub_part:表示索引的长度 Null:表示该字段是否能为空值 Index_type:表示索引类型 复制代码
- 为表添加索引
就拿上面的book表来说。本来已经有了一个year_publication,现在我们为该表在加一个普通索引
ALTER TABLE book ADD INDEX BkNameIdx(bookname(30)); 复制代码
看输出结果,就能知道,添加索引成功了。
这里只是拿普通索引做个例子,添加其他索引也是一样的。依葫芦画瓢而已。这里就不一一做讲解了。
- 使用CREATE INDEX创建索引
格式:CREATE [UNIQUE|FULLTEXT|SPATIAL] [INDEX|KEY] 索引名称 ON 表名(创建索引的字段名[length])[ASC|DESC]
解释:其实就是换汤不换药,格式改变了一下而已,做的事情跟上面完全一样,做一个例子。
在为book表增加一个普通索引,字段为authors。
CREATE INDEX BkBookNameIdx ON book(bookname); 复制代码
SHOW INDEX FROM book\G; //查看book表中的索引 复制代码
解释:第一条截图没截到,因为图太大了,这里只要看到有我们新加进去的索引就证明成功了。。其他索引也是一样的创建。
删除索引
前面讲了对一张表中索引的添加,查询的方法。
添加的两种方式
1在创建表的同时如何创建索引,
2在创建了表之后如何给表添加索引的两种方式,
查询的方式
SHOW INDEX FROM 表名\G; 复制代码
\G只是让输出的格式更好看
现在来说说如何给表删除索引的两种操作。
- 格式一:ALTER TABLE 表名 DROP INDEX 索引名
很简单的语句,现在通过一个例子来看看,还是对book表进行操作,删除我们刚才为其添加的索引。
1、删除book表中的名称为BkBookNameIdx的索引。
ALTER TABLE book DROP INDEX BkBookNameIdx; 复制代码
SHOW INDEX FROM book\G; //在查看book表中的索引,就会发现BkBookNameIdx这个索引已经不在了 复制代码
- 格式二:DROP INDEX 索引名 ON 表名
删除book表中名为BkNameIdx的索引
DROP INDEX BkNameIdx ON book; SHOW INDEX FROM book\G; 复制代码
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网
猜你喜欢:- MySQL索引使用说明(单列索引和多列索引)
- Elasticsearch索引的基本操作(3)-索引的滚动索引
- Coreseek 增量索引模拟实时索引
- Coreseek 增量索引模拟实时索引
- MySQL高效索引之覆盖索引
- MySQL -- 普通索引与唯一索引
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
大数据系统构建
Nathan Marz、James Warren / 马延辉、向磊、魏东琦 / 机械工业出版社 / 2017-1 / 79.00
随着社交网络、网络分析和智能型电子商务的兴起,传统的数据库系统显然已无法满足海量数据的管理需求。 作为一种新的处理模式,大数据系统应运而生,它使用多台机器并行工作,能够对海量数据进行存储、处理、分析,进而帮助用户从中提取对优化流程、实现高增长率的有用信息,做更为精准有效的决策。 但不可忽略的是,它也引入了大多数开发者并不熟悉的、困扰传统架构的复杂性问题。 本书将教你充分利用集群硬件优势的La......一起来看看 《大数据系统构建》 这本书的介绍吧!