文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

MySQL SQL优化之‘%’

2024-04-02 19:55

关注

设计索引的主要目的就是帮助我们快速获取查询结果,而以%开头的like查询则不能够使用B-Tree索引。
考虑到innodb的表都是聚簇表(类似于oracle中的索引组织表),且二级索引叶节点中记录的结构为(索引字段->主键字段),我们可以通过改写sql(mysql优化器比较笨,需要给它足够的提示)采取一种轻量级的方式代替全表扫:
使用索引全扫描找到主键,再根据主键回表获取数据的方法。
这种方式的速度优势在单行记录长度较大、表中记录较多的情况下体现的尤为明显,因为此时索引全扫描带来的IO开销相对于全表扫会小得多。

纸上得来终觉浅,绝知此事要躬行:
创建测试表test,表上有自增主键primary(id)和二级索引idx_name1(name1),表中有500万条数据。

mysql> desc test;
+--------+-------------+------+-----+---------+----------------+
| Field  | Type        | Null | Key | Default | Extra          |
+--------+-------------+------+-----+---------+----------------+
| id     | int(11)     | NO   | PRI | NULL    | auto_increment |
| name1  | varchar(20) | YES  | MUL | NULL    |                |
| name2  | varchar(20) | YES  |     | NULL    |                |
| name3  | varchar(20) | YES  |     | NULL    |                |
| name4  | varchar(20) | YES  |     | NULL    |                |
| name5  | varchar(20) | YES  |     | NULL    |                |
| name6  | varchar(20) | YES  |     | NULL    |                |
| name7  | varchar(20) | YES  |     | NULL    |                |
| name8  | varchar(20) | YES  |     | NULL    |                |
| name9  | varchar(20) | YES  |     | NULL    |                |
| name10 | varchar(20) | YES  |     | NULL    |                |
+--------+-------------+------+-----+---------+----------------+
11 rows in set (0.01 sec)

mysql> show index from test\G
*************************** 1. row ***************************
        Table: test
   Non_unique: 0
     Key_name: PRIMARY
 Seq_in_index: 1
  Column_name: id
    Collation: A
  Cardinality: 4829778
     Sub_part: NULL
       Packed: NULL
         Null: 
   Index_type: BTREE
      Comment: 
Index_comment: 
*************************** 2. row ***************************
        Table: test
   Non_unique: 1
     Key_name: idx_name1
 Seq_in_index: 1
  Column_name: name1
    Collation: A
  Cardinality: 2414889
     Sub_part: NULL
       Packed: NULL
         Null: YES
   Index_type: BTREE
      Comment: 
Index_comment: 
2 rows in set (0.00 sec)

mysql> select count(*) from test;
+----------+
| count(*) |
+----------+
|  5000000 |
+----------+
1 row in set (1.59 sec)

基于name1进行like查询,耗时11.13s,从执行计划看,sql在执行时走的是全表扫描(type: ALL):

mysql>  select * from test where name1 like '%O4JljqZw%'\G
*************************** 1. row ***************************
    id: 1167352
 name1: BO4JljqZws
 name2: BrfLU7J69j
 name3: XFikCVEilI
 name4: lr0yz3qMsO
 name5: vUUDghq8dx
 name6: RvQvSHHg4p
 name7: ESiDbQuK8f
 name8: GugFnLtYe8
 name9: OuPwY8BsiY
name10: O0oNGPX9IW
1 row in set (11.13 sec)

mysql> explain select * from test where name1 like '%O4JljqZw%'\G
*************************** 1. row ***************************
           id: 1
  select_type: SIMPLE
        table: test
         type: ALL
possible_keys: NULL
          key: NULL
      key_len: NULL
          ref: NULL
         rows: 4829778
        Extra: Using where
1 row in set (0.00 sec)

将sql改写为‘select a. from test a,(select id from test where name1 like '%O4JljqZw%') b where a.id=b.id;’
提示优化器在子查询中使用二级索引idx_name1获取id:

mysql> select a.* from test a,(select id from test where name1 like '%O4JljqZw%') b where a.id=b.id\G
*************************** 1. row ***************************
    id: 1167352
 name1: BO4JljqZws
 name2: BrfLU7J69j
 name3: XFikCVEilI
 name4: lr0yz3qMsO
 name5: vUUDghq8dx
 name6: RvQvSHHg4p
 name7: ESiDbQuK8f
 name8: GugFnLtYe8
 name9: OuPwY8BsiY
name10: O0oNGPX9IW
1 row in set (2.46 sec)

mysql> explain select a.* from test a,(select id from test where name1 like '%O4JljqZw%') b where a.id=b.id\G
*************************** 1. row ***************************
           id: 1
  select_type: PRIMARY
        table: <derived2>
         type: ALL
possible_keys: NULL
          key: NULL
      key_len: NULL
          ref: NULL
         rows: 4829778
        Extra: NULL
*************************** 2. row ***************************
           id: 1
  select_type: PRIMARY
        table: a
         type: eq_ref
possible_keys: PRIMARY
          key: PRIMARY
      key_len: 4
          ref: b.id
         rows: 1
        Extra: NULL
*************************** 3. row ***************************
           id: 2
  select_type: DERIVED
        table: test
         type: index
possible_keys: NULL
          key: idx_name1
      key_len: 63
          ref: NULL
         rows: 4829778
        Extra: Using where; Using index
3 rows in set (0.00 sec)

改写后的sql执行时间缩短至2.46s,效率提升了近4倍!
执行计划分析如下:
step 1:mysql先对二级索引idx_name1进行覆盖扫描取出符合条件的id(Using where; Using index)
step 2:对子step 1衍生出来的结果集table: <derived2>进行全表扫,获取id(本案例中只有一个id符合条件)
step 3:最后根据step 2中的id使用主键回表获取数据(type: eq_ref,key: PRIMARY )

总结:
在表中每条记录的长度较大时,通过这种方法改写后的sql效率会有明显提升。
本实验中每条记录的长度还很小(只有100多字节),如果每条记录的长度进一步加大,改写后sql的执行效率会有数量级的提升,大家可以自行验证~

阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-数据库
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯