优化临时表使用,SQL语句性能提升100倍
发布日期:2021-09-03 11:45:56 浏览次数:1 分类:技术文章

本文共 3064 字,大约阅读时间需要 10 分钟。

【问题现象】

  线上mysql数据库爆出一个慢查询,DBA观察发现,查询时服务器IO飙升,IO占用率达到100%, 执行时间长达7s左右。
  SQL语句如下:
  SELECT DISTINCT g.*, cp.name AS cp_name, c.name AS category_name, t.name AS type_name FROMgm_game g LEFT JOIN gm_cp cp ON cp.id = g.cp_id AND cp.deleted = 0 LEFT JOIN gm_category c ON c.id = g.category_id AND c.deleted = 0 LEFT JOIN gm_type t ON t.id = g.type_id AND t.deleted = 0 WHERE g.deleted = 0 ORDER BY g.modify_time DESC LIMIT 20 ;
  【问题分析】
  使用explain查看执行计划,结果如下:

  这条sql语句的问题其实还是比较明显的:

  查询了大量数据(包括数据条数、以及g.* ),然后使用临时表order by,但最终又只返回了20条数据。
  DBA观察到的IO高,是因为sql语句生成了一个巨大的临时表,内存放不下,于是全部拷贝到磁盘,导致IO飙升。
  【优化方案】
  优化的总体思路是拆分sql,将排序操作和查询所有信息的操作分开。
  第一条语句:查询符合条件的数据,只需要查询g.id即可
  SELECT DISTINCT g.id FROM gm_game g LEFT JOIN gm_cp cp ON cp.id = g.cp_id AND cp.deleted = 0 LEFT JOIN gm_category c ON c.id = g.category_id AND c.deleted = 0 LEFT JOIN gm_type t ON t.id = g.type_id AND t.deleted = 0 WHERE g.deleted = 0 ORDER BY g.modify_time DESC LIMIT 20 ;
  第二条语句:查询符合条件的详细数据,将第一条sql的结果使用in操作拼接到第二条的sql
  SELECT DISTINCT g.*, cp.name AS cp_name,c.name AS category_name,t.name AS type_name FROMgm_game g LEFT JOIN gm_cp cp ON cp.id = g.cp_id AND cp.deleted = 0 LEFT JOIN gm_category c ON c.id = g.category_id AND c.deleted = 0 LEFT JOIN gm_type t ON t.id = g.type_id AND t.deleted = 0 WHERE g.deleted = 0 and g.id in(…………………) ORDER BY g.modify_time DESC ;
  【实测效果】
  在SATA机器上测试,优化前大约需要50s,优化后第一条0.3s,第二条0.1s,优化后执行速度是原来的100倍以上,IO从100%降到不到1%
  在SSD机器上测试,优化前大约需要7s,优化后第一条0.3s,第二条0.1s,优化后执行速度是原来的10倍以上,IO从100%降到不到1%
  可以看出,优化前磁盘io是性能瓶颈,SSD的速度要比SATA明显要快,优化后磁盘不再是瓶颈,SSD和SATA性能没有差别。
  【理论分析】
  MySQL在执行SQL查询时可能会用到临时表,一般情况下,用到临时表就意味着性能较低。
  临时表存储
  MySQL临时表分为“内存临时表”和“磁盘临时表”,其中内存临时表使用MySQL的MEMORY存储引擎,磁盘临时表使用MySQL的MyISAM存储引擎;
  一般情况下,MySQL会先创建内存临时表,但内存临时表超过配置指定的值后,MySQL会将内存临时表导出到磁盘临时表;
  Linux平台上缺省是/tmp目录,/tmp目录小的系统要注意啦。
  使用临时表的场景
  1)ORDER BY子句和GROUP BY子句不同, 例如:ORDERY BY price GROUP BY name;
  2)在JOIN查询中,ORDER BY或者GROUP BY使用了不是第一个表的列 例如:SELECT * from TableA, TableB ORDER BY TableA.price GROUP by TableB.name
  3)ORDER BY中使用了DISTINCT关键字 ORDERY BY DISTINCT(price)
  4)SELECT语句中指定了SQL_SMALL_RESULT关键字 SQL_SMALL_RESULT的意思就是告诉MySQL,结果会很小,请直接使用内存临时表,不需要使用索引排序 SQL_SMALL_RESULT必须和GROUP BY、DISTINCT或DISTINCTROW一起使用 一般情况下,我们没有必要使用这个选项,让MySQL服务器选择即可。
直接使用磁盘临时表的场景
  1)表包含TEXT或者BLOB列;
  2)GROUP BY 或者 DISTINCT 子句中包含长度大于512字节的列;
  3)使用UNION或者UNION ALL时,SELECT子句中包含大于512字节的列;
  临时表相关配置
  tmp_table_size:指定系统创建的内存临时表最大大小;
  
  max_heap_table_size: 指定用户创建的内存表的最大大小;
  
  注意:最终的系统创建的内存临时表大小是取上述两个配置值的最小值。
  表的设计原则
  使用临时表一般都意味着性能比较低,特别是使用磁盘临时表,性能更慢,因此我们在实际应用中应该尽量避免临时表的使用。 常见的避免临时表的方法有:
  1)创建索引:在ORDER BY或者GROUP BY的列上创建索引;
  2)分拆很长的列:一般情况下,TEXT、BLOB,大于512字节的字符串,基本上都是为了显示信息,而不会用于查询条件, 因此表设计的时候,应该将这些列独立到另外一张表。
  SQL优化
  如果表的设计已经确定,修改比较困难,那么也可以通过优化SQL语句来减少临时表的大小,以提升SQL执行效率。
  常见的优化SQL语句方法如下:
  1)拆分SQL语句
  临时表主要是用于排序和分组,很多业务都是要求排序后再取出详细的分页数据,这种情况下可以将排序和取出详细数据拆分成不同的SQL,以降低排序或分组时临时表的大小,提升排序和分组的效率,我们的案例就是采用这种方法。
  2)优化业务,去掉排序分组等操作
  有时候业务其实并不需要排序或分组,仅仅是为了好看或者阅读方便而进行了排序,例如数据导出、数据查询等操作,这种情况下去掉排序和分组对业务也没有多大影响。
  如何判断使用了临时表?
  使用explain查看执行计划,Extra列看到Using temporary就意味着使用了临时表。

最新内容请见作者的GitHub页:

转载地址:https://blog.csdn.net/weixin_34186950/article/details/90501849 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!

上一篇:QTP中Report知识点总结
下一篇:为什么传感器掌握了物联网的未来

发表评论

最新留言

很好
[***.229.124.182]2024年03月25日 15时29分07秒

关于作者

    喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!

推荐文章

方差和标准差 2021-06-29
置信区间,上限,下限之间关系。 2021-06-29
准确率,精准率,召回率 - 机器学习性能评估指标 2021-06-29
概率论的意义 - 和深度学习的区别 2021-06-29
遗传算法 神经网络 深度学习 概率论 模糊数学 之间有什么区别? 2021-06-29
euler angle 欧拉角 -- 表达旋转的最简单的一种方式 2021-06-29
APQP , PPQP, ESO之间关系 2021-06-29
汽车车速信号来自哪里,仪表显示车速和实际车速关系 2021-06-29
DSP特点 - 与GPU,CPU,FPGA比较 2021-06-29
CAN-FD node 接入CAN network 2019-04-26
ACM-2019年湖南省省赛备战-模板+【程序员专用壁纸】 2019-04-26
C++新发现:__gcd()函数 求最大公约数直接调用完事了?? 2019-04-26
C++ 给定n个数,求这n个数的公约数的个数(__gcd()函数使用) 2019-04-26
Codeforces Round #579 (Div. 3) D2. Remove the Substring (hard version) 2019-04-26
Codeforces Round #579 (Div. 3), problem: (E) Boxers【贪心】 2019-04-26
Codeforces Round #579 (Div. 3), problem: (F1) Complete the Projects (easy version) 【两次贪心】 2019-04-26
2019年(第15届)湖南省大学生计算机程序设计竞赛之【赛前动员暨暑假集训总结】 2019-04-26
【bzoj4563】【HAOI2016】放棋子(高精度+错排+java) 2019-04-26
2017 CCPC 秦皇岛 G 题 & ZOJ 3987 - Numbers (高精度+贪心) 2019-04-26
牛客网(选择困难症)+ 长沙理工大学第十二届ACM大赛 L 选择困难症 (DFS) 2019-04-26