你怎么理解mysql索引 mysql索引背后的数据结构及算法原理

mysql索引有什么用？

先正面回答你的问题

目前成都创新互联公司已为上千多家的企业提供了网站建设、域名、网页空间、网站运营、企业网站设计、辽源网站维护等服务，公司将坚持客户导向、应用为本的策略，正道将秉承"和谐、参与、激情"的文化，与客户和合作伙伴齐心协力一起成长，共同发展。

数据是否重复不是建立索引的重要依据，甚至都不是依据。

只要不完全重复（所有元组的该元素都一样），那么建立索引就是有意义的。

即使当前数据完全重复，也不是不能建立索引，这种情况有点复杂，不细说了。

对于你后面的疑问，可以给你一个如何建立索引的忠告，“如何查就如何建”。

索引的建立，唯一的原因就是为了查询（广义的查询），实际上建立索引会使得数据存储所占空间变大，有时索引所占的空间会查过数据本身的空间。索引的建立也会使得数据插入时变慢，特殊情况下，慢的难以忍受，所以dba的重要工作之一，就是检查索引层级并优化。

索引建立的唯一好处，就是按照索引查询时，变快了。type，status这2个字段是否适合建立索引，就要看你是否要按照这2个字段进行检索。而检索的顺序决定了如何建立索引。

对于索引类型和索引方式，我建议就

normal

和

btree

就适用于大多数情况。若你参与的是一个大数据处理项目，对数据存储和检索有特别要求，那么需要分析多个层面，比如数据吞吐量、数据的方差、平均差等等很多参数才考虑是否用聚集索引等（mysql好像还没聚集索引），至于是否是唯一索引，我建议不使用，即使能判定数据是唯一的也不要用，全文索引也没有必要。

如何理解并正确使用MySql索引

MySQL索引类型包括：

（1）普通索引

这是最基本的索引，它没有任何限制。它有以下几种创建方式：

◆创建索引

CREATE INDEX indexName ON mytable(username(length)); 如果是CHAR，VARCHAR类型，length可以小于字段实际长度；如果是BLOB和TEXT类型，必须指定 length，下同。

◆修改表结构

ALTER mytable ADD INDEX [indexName] ON (username(length))

◆创建表的时候直接指定

CREATE TABLE mytable( ID INT NOT NULL, username VARCHAR(16) NOT NULL, INDEX [indexName] (username(length)) ); 删除索引的语法：

DROP INDEX [indexName] ON mytable;

（2）唯一索引

与前面的普通索引类似，不同的就是：索引列的值必须唯一，但允许有空值。如果是组合索引，则列值的组合必须唯一。它有以下几种创建方式：

◆创建索引

CREATE UNIQUE INDEX indexName ON mytable(username(length))

◆修改表结构

ALTER mytable ADD UNIQUE [indexName] ON (username(length))

深入理解mysql的联合索引

最近在学习MySQL的存储引擎和索引的知识。看了许多篇介绍MyISAM和InnoDB的索引的例子，都能理解。

像这张索引图：

PS:该图来自大神张洋的《MySQL索引背后的数据结构及算法原理》一文。

但许多文章讲述的都是单列索引，我很好奇联合索引对应的结构图是怎样的。

比方说联合索引 (col1, col2,col3)，我知道在逻辑上是先按照col1进行排序再按照col2进行排序最后再按照col3进行排序。因此如果是select * from table where col1 = 1 and col3 = 3的话，只有col1的索引部分能生效。但是其物理结构上这个联合索引是怎样存在的，我想不懂。

上网查阅了许多资料，总算有点眉目了。

假设这是一个多列索引(col1, col2,col3)，对于叶子节点，是这样的：

PS:该图改自《MySQL索引背后的数据结构及算法原理》一文的配图。

也就是说，联合索引(col1, col2,col3)也是一棵B+Tree，其非叶子节点存储的是第一个关键字的索引，而叶节点存储的则是三个关键字col1、col2、col3三个关键字的数据，且按照col1、col2、col3的顺序进行排序。

配图可能不太让人满意，因为col1都是不同的，也就是说在col1就已经能确定结果了。自己又画了一个图（有点丑），col1表示的是年龄，col2表示的是姓氏，col3表示的是名字。如下图：

PS:对应地址指的是数据记录的地址。

如图，联合索引(年龄, 姓氏,名字)，叶节点上data域存储的是三个关键字的数据。且是按照年龄、姓氏、名字的顺序排列的。

因此，如果执行的是：

select * from STUDENT where 姓氏='李' and 名字='安';

或者

select * from STUDENT where 名字='安';

那么当执行查询的时候，是无法使用这个联合索引的。因为联合索引中是先根据年龄进行排序的。如果年龄没有先确定，直接对姓氏和名字进行查询的话，就相当于乱序查询一样，因此索引无法生效。因此查询是全表查询。

如果执行的是：

select * from STUDENT where 年龄=1 and 姓氏='李';

那么当执行查询的时候，索引是能生效的，从图中很直观的看出，age=1的是第一个叶子节点的前6条记录，在age=1的前提下，姓氏=’李’的是前3条。因此最终查询出来的是这三条，从而能获取到对应记录的地址。

如果执行的是：

select * from STUDENT where 年龄=1 and 姓氏='黄' and 名字='安';

那么索引也是生效的。

而如果执行的是：

select * from STUDENT where 年龄=1 and 名字='安';

那么，索引年龄部分能生效，名字部分不能生效。也就是说索引部分生效。

因此我对联合索引结构的理解就是B+Tree是按照第一个关键字进行索引，然后在叶子节点上按照第一个关键字、第二个关键字、第三个关键字…进行排序。

而之所以会有最左原则，是因为联合索引的B+Tree是按照第一个关键字进行索引排列的。

联合索引在B+树上的结构介绍

文章标题：你怎么理解mysql索引 mysql索引背后的数据结构及算法原理
本文URL：http://scyanting.com/article/ddchsho.html

你怎么理解mysql索引 mysql索引背后的数据结构及算法原理

mysql索引有什么用？

如何理解并正确使用MySql索引

深入理解mysql的联合索引

其他资讯