Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >美团点评SQL优化工具SQLAdvisor开源

美团点评SQL优化工具SQLAdvisor开源

作者头像
美团技术团队
发布于 2018-03-12 12:30:41
发布于 2018-03-12 12:30:41
2.5K10
代码可运行
举报
文章被收录于专栏:美团技术团队美团技术团队
运行总次数:0
代码可运行

介绍

数据库运维过程中,优化 SQL 是 DBA 团队的日常任务。例行 SQL 优化,不仅可以提升程序性能,还能够降低线上故障的概率。

目前常用的 SQL 优化方式包括但不限于:业务层优化、SQL逻辑优化、索引优化等。其中索引优化通常通过调整索引或新增索引从而达到 SQL 优化的目的。索引优化往往可以在短时间内产生非常巨大的效果。如果能够将索引优化转化成工具化、标准化的流程,减少人工介入的工作量,无疑会大大提高DBA的工作效率。

SQLAdvisor 是由美团点评公司北京DBA团队开发维护的 SQL 优化工具:输入SQL,输出索引优化建议。 它基于 MySQL 原生词法解析,再结合 SQL 中的 where 条件以及字段选择度、聚合条件、多表 Join 关系等最终输出最优的索引优化建议。目前 SQLAdvisor 在公司内部大量使用,较为成熟、稳定。

现在,我们非常高兴地将 SQLAdvisor 开源,项目 GitHub 地址:https://github.com/Meituan-Dianping/SQLAdvisor 。我们已经把相关开发工作全面转到 GitHub 上,开源版本和内部使用版本保持完全一致。希望与业内有类似需求的团队,一起打造一款优秀的 SQL 优化产品。

SQLAdvisor架构流程图:

SQLAdvisor使用举例

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
sql: SELECT id FROM crm_loan WHERE id_card = '1234567'
cmd: ./sqladvisor -h xx -P xx -u xx -pxx -d xx -q "SELECT id FROM crm_loan WHERE id_card = '1234567'"
SQLAdvisor输出: alter table crm_loan add index idx_id_card(id_card)

SQLAdvisor快速入门教程

SQLAdvisor的优点

  • 基于 MySQL 原生词法解析,充分保证词法解析的性能、准确定以及稳定性;
  • 支持常见的 SQL(Insert/Delete/Update/Select);
  • 支持多表 Join 并自动逻辑选定驱动表;
  • 支持聚合条件 Order by 和 Group by;
  • 过滤表中已存在的索引。

SQLAdvisor原理介绍

Join 处理

  1. Join语法分为两种:Join on 和 Join using,且 Join on 有时会存在 where 条件中。
  2. 分析 Join 条件首先会得到一个 nested_join 的 table list,通过判断它 join_using_fields 字段是否为空来区分 Join on 与 Join using。
  3. 生成的 table list 以二叉树的形式进行存储,以后序遍历的方式对二叉树进行遍历。
  4. 生成内部解析树时,right Join 会转换成 left Join。
  5. Join 条件会存在当层的叶子节点上,如果左右节点都是叶子节点,会存在右叶子节点。
  6. 每一个非叶子节点代表一次 Join 的结果。

上述实现时,涉及的函数为:mysql_sql_parse_join(TABLE_LIST join_table) mysql_sql_parse_join(Item join_condition) ,主要流程图如下:

where处理

  1. 主要是提取 SQL 语句的 where 条件。where 条件中一般由 AND 和 OR 连接符进行连接,因为 OR 比较难以处理,所以忽略,只处理 AND 连接符。
  2. 由于 where 条件中可以存在 Join 条件,因此需要进行区分。
  3. 依次获取 where 条件,当条件中的操作符是 like,如果不是前缀匹配则丢弃这个条件。
  4. 根据条件计算字段的区分度按照高低进行倒序排,如果小于30则丢弃。同时使用最左原则将 where 条件进行有序排列。

计算区分度

  1. 通过 “show table status like” 获得表的总行数 table_count。
  2. 通过计算选择表中已存在的区分度最高的索引 best_index,同时Primary key > Unique key > 一般索引。
  3. 通过计算获取数据采样的起始值offset与采样范围rand_rows:
    • offset = (table_count / 2) > 10W ? 10W : (table_count / 2)
    • rand_rows =(table_count / 2) > 1W ? 1W : (table_count / 2)
    • 使用select count(1) from (select field from table force index(best_index) order by cl.. desc limit rand_rows) where field_print 得到满足条件的rows。
    • cardinality = rows == 0 ? rand_rows : rand_rows / rows;
    • 计算完成选择度后,会根据选择度大小,将该条件添加到该表中的备选索引中。

主要涉及的函数为:mysql_sql_parse_field_cardinality_new() 计算选择度。

添加备选索引

  1. mysql_sql_parse_index()将条件按选择度添加到备选索引链表中。
  2. 上述两函数的流程图如下所示:

Group 与 Order 处理

  1. Group 字段与 Order 字段能否用上索引,需要满足如下条件:
    • 涉及到的字段必须来自于同一张表,并且这张表必须是确定下来的驱动表。
    • Group by 优于 Order by, 两者只能同时存在一个。
    • Order by 字段的排序方向必须完全一致,否则丢弃整个 Order by 字段列。
    • 当 Order by 条件中包含主键时,如果主键字段为 Order by。 字段列末尾,忽略该主键,否则丢弃整个 Order by 字段列。
  2. 整个索引列排序优先级:等值>(group by | order by )> 非等值。
  3. 该过程中设计的函数主要有:
    • mysql_sql_parse_group() 判断 Group 后的字段是否均来自于同一张表。
    • mysql_sql_parse_order() 判断 Order 后的条件是否可以使用。
    • mysql_sql_parse_group_order_add() 将字段依次按照规则添加到备选索引链表中。

驱动表选择

  1. 经过前期的 where 解析、Join 解析,已经将 SQL 中表关联关系存储起来,并且按照一定逻辑将候选驱动表确定下来。
  2. 在侯选驱动表中,按照每一张表的侯选索引字段中第一个字段进行计算表中结果集大小。
  3. 使用 explain select * from table where field 来计算表中结果集。
  4. 结果集小最小的被确为驱动表。
  5. 步骤中涉及的函数为:final_table_drived(),在该函数中,调用了函数 get_join_table_result_set() 来获取每张驱动候选表的行数。

添加被驱动表备选索引

  1. 通过上述过程,已经选择驱动表,也通过解析保存了语句中的条件。
  2. 由于选定了驱动表,因此需要对被驱动表的索引,根据 Join 条件进行添加。
  3. 该过程涉及的函数主要是:mysql_index_add_condition_field(),流程如下:

输出建议

  1. 通过上述步骤,已经将每张表的备选索引键全部保存。此时,只要判断每张表中的候选索引键是否在实际表中已存在。没有索引,则给出建议增加对应的索引。
  2. 该步骤涉及的函数是:print_index() ,主要的流程图为:

SQLAdvisor版本更新

  • Functionality Added or Changed
    • 调整架构将 SQLParser 与 SQLAdvisor 模块隔离,方便调试。
    • 重新架构多表 Join 关系的 find_join_elements() 函数,思路更加清晰。
    • 修改选定驱动表的策略,确保驱动表为小结果集。
    • 添加 where 条件中的 like 处理。
    • 优化 Order by 逻辑,忽略 Order by primary key 场景。
    • 输出索引建议前,增加判断索引是否已存在。
  • Bugs Fixed
    • 修复 SQL 无法处理中文问题。
    • 修复字段多次出现在 where 条件中从而导致多次出现在索引列中问题。
    • 修复在 find_best_index() 函数中,对 MySQL API 中的 result 对象提前 free,导致指针失效问题。

愿景

和各位同行共同打造一款企业级优秀的 SQL 优化产品,希望大家能够积极参与。

欢迎大家将需求或发现的 Bug 在 Github 上提交 issue,帮助 SQLAdvisor 逐渐壮大;也欢迎大家在 SQLAdvisor 用户交流群(QQ: 231434335)相互交流,共同学习。

SQLAdvisor手册

  1. SQLAdvisor快速入门教程.
  2. SQLAdvisor原理和架构.
  3. SQLAdvisor release notes.
  4. SQLAdvisor开发规范.
  5. FAQ.
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2017-03-09,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 美团点评技术团队 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
1 条评论
热度
最新
博主,在部署使用SQLAdvisor时,两个表简单表的Join,会在输出索引建议时卡住,即:2019-04-28 11:27:21 5345 [Note] 第4步:开始解析join on条件:cancel.Code=detail.CancelCode2019-04-28 11:27:21 5345 [Note] 第5步:开始选择驱动表,一共有2个候选驱动表2019-04-28 11:27:21 5345 [Note] explain select * from DicCancelRules 到此处后再无反应。。,求教如何处理这样的现象?是配置有误?还是?
博主,在部署使用SQLAdvisor时,两个表简单表的Join,会在输出索引建议时卡住,即:2019-04-28 11:27:21 5345 [Note] 第4步:开始解析join on条件:cancel.Code=detail.CancelCode2019-04-28 11:27:21 5345 [Note] 第5步:开始选择驱动表,一共有2个候选驱动表2019-04-28 11:27:21 5345 [Note] explain select * from DicCancelRules 到此处后再无反应。。,求教如何处理这样的现象?是配置有误?还是?
回复回复点赞举报
推荐阅读
编辑精选文章
换一批
SQL优化神器-SQLAdvisor
曾几何时,你为了一条sql效率寻遍互联网的每个角落,也许,你会读到这么一篇sql优化的文章《MySQL索引原理及慢查询优化》,然后你恍然大悟,sql索引还有一个叫最左前缀匹配的原则,并不是一味的建索引就可以解决慢查询的问题。今天,有这样一个工具,在你还在思考如何最左前匹配的时候 ,他已经帮你解析快速分析出你的sql,并给出索引优化建议,是不是很nice,好了,废话不多说了,重点在下面啦
kl博主
2023/11/18
4270
SQL优化神器-SQLAdvisor
【MySQL】SQLAdvisor的简单安装使用
SQLAdvisor 是由美团点评公司北京DBA团队开发维护的 SQL 优化工具:输入SQL,输出索引优化建议。 它基于 MySQL 原生词法解析,再结合 SQL 中的 where 条件以及字段选择度、聚合条件、多表 Join 关系等最终输出最优的索引优化建议。目前 SQLAdvisor 在公司内部大量使用,较为成熟、稳定。 项目 GitHub 地址:https://github.com/Meituan-Di... SQLAdvisor架构流程图 SQLAdvisor 包含了如下的处理方式:Join 处理、where 处理、计算区分度、添加备选索引、Group 与 Order 处理、驱动表选择、添加被驱动表备选索引、输出建议,具体的流程图可以参考https://tech.meituan.com/2017...
用户5522200
2020/06/11
2K0
第10章_索引优化与查询优化
🧑个人简介:大家好,我是 shark-Gao,一个想要与大家共同进步的男人😉😉
程序员Leo
2023/08/02
4970
第10章_索引优化与查询优化
SQL优化的几点建议
面试也经常问到“MySQL索引的数据结构是什么?”、“MySQL慢查询怎么看?”、“聚簇索引和非聚簇索引的区别是什么?”,“怎么SQL优化”等等。
明明如月学长
2021/08/31
6690
SQL优化的几点建议
SQL优化看这一篇就够了
索引是帮助MySQL高效获取数据的数据结构。索引内部存在一个键值和对应数据的物理地址,当数据很多的时候,索引文件会很大,所以一般以文件的形式存储于磁盘中,后缀名为.myi。
石的三次方
2021/01/05
8870
SQL优化中新建索引真的比Explain好?面试官:你出去吧
前几天老大问我怎么进行sql优化的,我回答了新建索引。哈哈哈,然后老大就出去找棍子了,进来之后跟我说你知道门在哪边吧,自己出去还是我请你出去?
Java程序猿阿谷
2021/01/04
5400
SQL优化中新建索引真的比Explain好?面试官:你出去吧
关于SQL优化若干
博主负责的项目主要采用阿里云数据库MySQL,最近频繁出现慢SQL告警,执行时间最长的竟然高达5分钟。导出日志后分析,主要原因竟然是没有命中索引和没有分页处理。其实这是非常低级的错误,我不禁后背一凉,团队成员的技术水平亟待提高啊。改造这些SQL的过程中,总结了一些经验分享给大家,如果有错误欢迎批评指正。
用户4283147
2022/10/27
3970
关于SQL优化若干
Mysql优化秘籍心法
(1)连接器:主要负责跟客户端建立连接,获取权限,维持和管理链接。 (2)查询缓存:优先在缓存中进行查询,如果查到了则直接返回,如果缓存中查不到,再去数据库查询。
用户8568307
2022/03/14
1K0
Mysql优化秘籍心法
Mysql慢sql优化
index 1.MySQL的执行过程 2.索引的定义 3.MySQL执行计划explain or desc 4.索引使用/创建规则 5.弊端 6.设计规范 7.SQL建议
oktokeep
2024/10/09
2020
Mysql慢sql优化
有哪些优化mysql索引的方式请举例(sqlserver索引优化)
myisam存储:如果表对事务要求不高,同时是以查询和添加为主的,我们考虑使用myisam存储引擎,比如bbs 中的发帖表,回复表
全栈程序员站长
2022/07/25
1.2K0
有哪些优化mysql索引的方式请举例(sqlserver索引优化)
SQL优化
此优化方案指的是通过优化 SQL 语句以及索引来提高 MySQL 数据库的运行效率,具体内容如下:
时代疯
2021/07/22
8150
霜皮剥落紫龙鳞,下里巴人再谈数据库SQL优化,索引(一级/二级/聚簇/非聚簇)原理
    举凡后端面试,面试官不言数据库则已,言则必称SQL优化,说起SQL优化,网络上各种“指南”和“圣经”难以枚举,不一而足,仿佛SQL优化已然是妇孺皆知的理论常识,然后根据多数无知(Pluralistic ignorance)理论,人们印象里觉得多数人会怎么想怎么做,但这种印象往往是不准确的。那SQL优化到底应该怎么做?本次让我们褪去SQL华丽的躯壳,以最浅显,最粗俗,最下里巴人的方式讲解一下SQL优化的前因后果,前世今生。
用户9127725
2022/08/08
2920
霜皮剥落紫龙鳞,下里巴人再谈数据库SQL优化,索引(一级/二级/聚簇/非聚簇)原理
SQL优化,我就用了这几招
阿里巴巴社区博客最近发表了一篇探究MySQL索引策略的博客,下图是一条查询SQL的执行过程。
JavaSouth南哥
2024/10/14
1920
SQL优化,我就用了这几招
SQL学习笔记之项目中常用的19条MySQL优化
MySQL对于IN做了相应的优化,即将IN中的常量全部存储在一个数组里面,而且这个数组是排好序的。但是如果数值较多,产生的消耗也是比较大的。再例如:select id from table_name where num in(1,2,3) 对于连续的数值,能用 between 就不要用 in 了;再或者使用连接来替换。
Jetpropelledsnake21
2018/08/10
5160
SQL学习笔记之项目中常用的19条MySQL优化
项目中至少提高3倍的19条MySQL优化
本文我们来谈谈项目中常用的MySQL优化方法,巧用这19条技巧,至少提高3倍效率,具体如下:
格姗知识圈
2019/07/19
6450
项目中至少提高3倍的19条MySQL优化
SQL优化思路+经典案例分析
SQL调优这块呢,大厂面试必问的。最近金九银十嘛,所以整理了SQL的调优思路,并且附几个经典案例分析。
捡田螺的小男孩
2023/02/24
9900
SQL优化思路+经典案例分析
MYSQL高级篇-----索引优化分析
由于有些mysql不能使用full join,不过可以换种方法表示 A 的独有 + AB 共有 + B的独有 union本身就可以去重 所以可以这样使用
默 语
2024/11/20
6080
MYSQL高级篇-----索引优化分析
SQL优化完整详解
通过 SHOW STATUS 可以提供服务器状态信息,也可以使用 mysqladmin extende d-status 命令获得。 SHOW STATUS 可以根据需要显示 session 级别的统计结果和 global级别的统计结果。
黄规速
2022/04/14
1.3K0
SQL优化完整详解
一张900w的数据表,16s执行的SQL优化到300ms?
有一张财务流水表,未分库分表,目前的数据量为9555695,分页查询使用到了limit,优化之前的查询耗时16 s 938 ms (execution: 16 s 831 ms, fetching: 107 ms),按照下文的方式调整SQL后,耗时347 ms (execution: 163 ms, fetching: 184 ms);
乔戈里
2021/09/16
4470
MySQL Slow Sql优化(面向研发)
文件名称格式:1.1.1.1_slow_2019-06-09_01_06_33.txt
MySQL轻松学
2019/11/12
1.9K0
相关推荐
SQL优化神器-SQLAdvisor
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验