首先我们看下百度百科上的解释:
在关系数据库中,索引是一种单独的、物理的对数据库表中一列或多列的值进行排序的一种存储结构,它是某个表中一列或若干列值的集合和相应的指向表中物理标识这些值的数据页的逻辑指针清单。索引的作用相当于图书的目录,可以根据目录中的页码快速找到所需的内容。
索引是独立于表的一中物理存储结构,当我们语句中用到索引的字段的时候,数据库会首先去索引中查找满足条件的数据的索引值(相当于页码),然后在根据索引值去表中筛选出我们的结果。 当我们使用索引和不使用索引的时候,效率会相差相当大,特别是当数据量越来越大的时候。 另外需要注意的是并不是我们在where条件里面用有索引的字段进行筛选数据库在查询的时候就会走索引,有些写法会让数据库不走索引,接下来会总结一些会让查询进行全表扫描而不走索引的写法;
SELECT * FROM USERS WHERE AGE = '14'
由于AGE是INT类型,当你写语句的时候在14上加上了单引号('),其实语句就变成了如下SELECT * FROM USERS WHERE TO_CHAR(AGE) = '14'
这就会导致索引失效进行全表扫描了。SELECT * FROM USERS WHERE NAME='张三' OR NAME = '李四'
可以改为SELECT * FROM USERS WHERE NAME='张三' UNION ALL SELECT * FROM USERS WHERE NAME='李四'
来进行查询。SELECT * FROM USERS WHERE NAME LIKE '%文%'
可以改为SELECT * FROM USERS WHERE INSTR(NAME,'文') >0
来进行查询。其实为什么要知道查询执行的逻辑顺序,原因很简单,为了尽量早的筛选出我们想要的数据,将不需要的数据进行计算是需要成本的,直观的表现就是查询变慢。 查询的执行顺序:
(8)SELECT (9)DISTINCT (11)<TOP NUM> <SELECT LIST>
(1)FROM [LEFT_TABLE]
(3)<JOIN_TYPE> JOIN <RIGHT_TABLE>
(2)ON <JOIN_CONDITION>
(4)WHERE <WHERE_CONDITION>
(5)GROUP BY <GROUP_BY_LIST>
(6)WITH <CUBE | ROLLUP>
(7)HAVING <HAVING_CONDITION>
(10)ORDER BY <ORDER_BY_LIST>
另外当WHERE后跟了多项筛选条件的时候,执行顺序是自右向左/自下向上,所以我们可以把能大量筛选掉数据的条件写在最后。
SELECT *
FROM USERS
WHERE test1 = '1'
AND test2 = '2'
test1和test2都是两个不存在的字段,执行的时候会如下报错:
image.png
SELECT 字段名
来代替SELECT *
;写SQL简单,优化SQL难,数据分析师之路长的很,慢慢走~ peace~