本文是MySQL(三)|《千万级大数据查询优化》第一篇:创建高性能的索引的一个补充。
主要包括如下几点:
sex
列创建索引的处理
sex可以理解为那种选择性不高,但是可能很多查询都会用到的列。考虑到使用的频率,还是建议在创建不同组合索引的时候将它作为前缀。
但是根据经验法则(将选择性最高的列放到索引最前列)不是说不应该在选择性低的列上创建索引吗?那为什么这里要将sex列字段作为索引的前缀列?这里有两个理由:
第一点,几乎所有的查询都会用到它;
第二点,索引中加上这一列也没有坏处,即使查询没有使用sex列也可以通过一些“诀窍”绕过,这个诀窍就是:如果每个查询不限制性别,那么可以通过在查询条件中新增AND SEX IN('m', 'f')
来让MySQL选择该索引。这样写并不会过滤任何行,和没有这个条件时返回的结果相同。但是必须加上这个列的条件,MySQL才能够匹配索引的最左前缀。idx_ab
、idx_ab
的索引,很多时候是在不经意间创建的。关于冗余,就得做一个说明啦。举例如下,我在新建一个表时,要把ID设置为主键,必须保证它是唯一的,还要在它身上加上索引:create table test(
ID INT NOT NULL PRIMARY KEY,
A INT NOT NULL,
B INT NOT NULL,
UNIQUE(ID),
INDEX(ID),
)ENGINE-InnoDB;
因为MySQL的唯一限制和主键限制都是通过索引实现的,所以实际上上面对ID创建了3个重复的索引。
如果创建了索引idx_ab
,再创建索引idx_a
就是冗余索引,创建索引idx_b
或idx_ba
都不是冗余索引。(这个冗余只是对B-Tree索引来说的)