1.sql语句编写2.explain 工具的使用--重点
1.执行大的delete、update、insert操作要慎重,特别是对业务繁忙的系统,要尽量避免对线上业务产生影响。
解决办法是:大操作切割为小操作,使用limit子句限制每次操作的记录数,也可以利用一些日期字段基于更小粒度的时间范围进行操作。
2.避免使用select * 语句,select语句之用于获取需要的字段。
3.使用预编译语句,可以提高性能并且防范 sql注入 攻击。
4.一般情况下update,delete 语句中不要使用limit。
5.where 条件语句中必须使用合适的类型,避免mysql进行隐式转换。
6.insert into 必须显式指明字段名称,不要使用insert into table()。
7.避免在sql 语句中进行数学运算或函数运算,避免将业务逻辑和数据存储耦合在一起。
8.insert 语句如果使用批量提交,如insert into table values(),()...那么values 的个数不应过多。一次性提交过多记录,会导致I/O紧张,出现慢查询。
9.避免使用存储过程、触发器、函数等,这些特性会将业务逻辑与数据库耦合在一起,并且MySQL的存储过程,触发器,函数中可能存在bug。
10.尽量避免使用子查询,连接。尽量将子查询转化为连接查询,mysql 查询优化器会优化连接查询,但连接的表要尽可能的少,如果很多,可以考虑反范式设计。即对设计阶段做一些改造。
11.使用合理的sql语句以减少与数据库的交互次数。
12.建议使用合理的分页技术以提高操作效率。
1.使用 explain 工具可以确认执行计划是否良好,查询是否走了合理的索引。
2.不同版本MySQL 优化器各有不同,一些优化规则随着版本的发展可能有变化,
查询的执行计划随着数据的变化也可能发生变化,这类情况就需要使用explain 来验证自己的判断。
执行如下脚本,观察控制台输出
explain select name from test where id = 32;
注意数据表使用如下脚本:
CREATE TABLE `test` (
`id` int(11) unsigned NOT NULL AUTO_INCREMENT,
`name` varchar(11) DEFAULT NULL,
PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=41 DEFAULT CHARSET=utf8;
table name = test、column1 = id、column2 = name.
执行结果如下所示:
下面详细阐述explain 输出的各项内容:
id:
包含一组数字,表示查询中执行 select子句 或操作表的顺序。 如果 id 相同,则执行顺序由上到下。
select_type:
表示查询中每个 select 子句的类型(是简单还是复杂)输出结果类似如下:1.simple查询中不包含子查询或者union2.primary查询中若包含任何复杂子查询,最外层查询被标记为primary3.subquery在select 或 where 列表中包含了子查询,则该查询被标记为subquery4.derived在from列表中包含的子查询被标记为derived(衍生)5.union若第二个select出现在union之后,则被标记为derived。6.union result从union表中获取结果的select将被标记为 union result。select_type 只需要了解分类即可,这个信息并不是最有价值的。
type:最有价值信息之一
type表示 MySQL 在表中找到所需行的方式,又称为“访问类型”,常见的类型如下所示: all、index、range、ref、eqref、const,system,null 以上类型,由左至右,由最差到最好。all: Full Table Scan,MySQL 将遍历全表以找到匹配的行。index:Full Index Scan,index 与 all 区别为index类型只遍历索引树。假设表中有主键字段id,则select id from tablename;type即为Full Index Scan。range:索引扫描范围,对索引的扫描开始于某一点,返回匹配的域或行,常见于between、<、>等的查询。ref:非唯一性索引扫描,将返回匹配某个单独值得所有行。常见于使用非唯一索引或唯一索引的非唯一前缀的查找。eq_ref:唯一性索引扫描,对于每个索引键表中只有一条记录与之匹配。常见于主键或唯一索引扫描。const、system:当MySQL对查询的某部分进行优化,并转化为一个常量时,可使用这些类型进行访问。如果主键置于where列表中,MySQL就能将该查询转换为一个常量,system是const 的一个特例,当查询的表只有一行的情况下,即可使用system。null:MySQL 在优化过程中分解语句,执行时甚至不用访问表或索引,举例如下: explain select * from (select * from t1 where id = 1)d1;
possible_keys
possible_keys 将指出MySQL能使用哪个索引在表中找到行,查询涉及的字段上若存在索引,则该索引将被列出,但不一定会被查询使用。
key:最有价值信息之二
key 将显示MySQL在查询中实际使用到的索引,若没有使用索引,则显示为null。查询中若使用到了覆盖索引,则该索引仅仅出现在 key 列表中,possible_keys中并不显示。
key_len
key_len表示索引中使用的字节数,可通过该列计算查询中使用的索引的长度。
ref
ref表示上述表的连接匹配条件,即哪些列或常亮被用于查找索引列上的值。
rows:最有价值信息之三
rows 表示MySQL根据表统计信息及索引选用的情况, 估算查找所需记录需要读取的行数。使用到索引一般情况下会使得rows的值降低。
Extra:最有价值信息之四
Extra 包含不适合在其他列中显示但十分重要的额外信息。可能包如下4种信息。1.Using index该值表示相应的select操作中使用到了覆盖索引,包含满足查询需要的数据的索引称为覆盖索引。2.Using where如果查询未能使用索引,则Using where 的作用只是提醒我们 MySQL 将用where 子句来过滤结果集。3.Using temporary表示MySQL需要使用临时表来存储结果集,常见于order by 与 group by,事实上group by会进行隐式的order by。 如果我们在group by 时利用索引分组(其实包含排序的过程)排序,则可以提高性能,因为不会此时查询输出里没有了Using temporary,Using filesort。
4.Using filesortUsing filesort 即文件排序,MySQL 中将无法使用索引完成的排序操作,称为文件排序。
上文篇幅有点长,但都是必须了解的概念。最有价值信息是我们判断sql语句执行是否高效的基准,了解四个最有价值信息是最重要的。
继续演示explain的使用,使用上文的评判标准来看下语句的执行效率:1.主键查询
上述为主键查询的explain信息 type = const 效率很高 key = primary 实际使用的索引为主键 rows = 1 查找的记录数为1 extra = null ,没有任何额外信息 总体来说,性能是极高。
2.主键范围查询
上述为主键范围查询的explain信息 type =range 范围查询,效率不是最低 key = primary 实际使用的索引为主键 rows = 7 查找的记录数为7 extra = Using where ,最终使用where 做结果集过滤,未使用到覆盖索引。 总体来说,性能是很高。
3.未带索引查询
如上图所示,name 并未做索引。 type =ALL Full Table Scan 全表查询 key =NULL 未使用索引 rows = 7 10数据库中所有记录 extra = Using where ,最终使用where 做结果集过滤,未使用到覆盖索引。 总体来说,性能极差。(这也是我司内部deviceId接口出问题的终极原因)。
4.未带索引的分组查询
如上图所示,name 并未做索引。 type =ALL Full Table Scan 全表查询 key =NULL 未使用索引 rows = 7 10数据库中所有记录 extra = Using where ,最终使用where 做结果集过滤,未使用到覆盖索引。并使用到了temporary,filesort 临时表与文件查询。 总体来说,性能极差。
5.带索引的分组查询
我们现在为4与3中 name 创建索引,再来看看分析结果 创建索引脚本如下alter table test add index idxname(name);
再运行3 和 4中的查询语句 结果如下图所示:
type =ref 非唯一索引扫描,效率不是最低 key =name 实际使用的索引name索引(注意:idxname与name都是在name字段上建立的索引)。 rows = 1 查找的记录数为1 extra = Using index ,最终使用到覆盖索引。 总体来说,查询性能是极高的。
type =range 范围扫描,效率不是最低 key =name 实际使用的索引name索引(注意:idx_name与name都是在name字段上建立的索引)。 rows = 1 查找的记录数为1 extra = Using index ,最终使用where 做结果集过滤,使用到覆盖索引。 总体来说,查询性能是极高的。
当然上述演示比较简单,也不是非常具备实战色彩,对于explain的使用,我们还应在更多的数据库操作场景中多多使用,这是sql调优的利器。为我们后期的调优减轻了负担,可以说如果在这一步做好了sql脚本的设计,那么后期关于 sql调优 问题会非常少。