应公司业务需求,开发一个费用统计报表;其实本来没啥技术含量,但是踩了一个坑需要记录一下;相信大家在写统计sql的时候,group by是经常会用到的吧,如果数据量过大呢?是不是需要分页,这里就需要用到limit作查询限制,那么问题就来了。。。下面是我踩的坑和解决方案
原查询sql如下
SELECTvbl.CALC_ID calcId,vbl.cons_no consNo,ep.cons_name consName,ved.create_time chargeDate,vbl.release_date releaseDate,IFNULL( aed.last_mr_num, 0 ) lastRead,IFNULL( aed.this_read, 0 ) thisRead,(IFNULL( aed.this_read, 0 ) - IFNULL( aed.last_mr_num, 0 )) meterRead,IFNULL( aed.CALCULATE_QUANTITY, 0 ) differenceRead,vbl.t_pq tPq,( SELECT cat_prc_name FROM ee_prc WHERE prc_code = ca.prc_code AND tenant_id = ca.tenant_id ) prcName,( SELECT nick_name FROM sys_user WHERE user_id = aep.reader_no ) meterReaderMan FROMea_rcvbl_flow vblLEFT JOIN ea_rcved_flow ved ON vbl.RCVBL_AMT_ID = ved.EA_RCVBL_AMT_IDINNER JOIN ec_premise ep ON vbl.cons_no = ep.cons_no AND vbl.tenant_id = ep.TENANT_IDINNER JOIN arc_er_data aed ON vbl.CALC_ID = aed.CALC_IDLEFT JOIN arc_er_plan aep ON aed.app_no = aep.app_noLEFT JOIN arc_ee_calc_amt ca ON ca.CALC_ID = vbl.CALC_ID WHEREvbl.TENANT_ID = '10000000232' AND vbl.settle_flag = '03' AND vbl.release_date BETWEEN '20220401' AND '20220510' AND EXISTS ( SELECT re.CALC_ID FROM ea_rcvbl_part_reduction re WHERE re.CALC_ID = vbl.CALC_ID ) GROUP BYvbl.CALC_ID limit 10
查询时间
10条结果居然要耗费11s,难以置信
查看sql执行计划
第一种方案:从执行计划中可以看出,只是用到了一个单值索引,并没有用到所用条件的组合索引,所以解决方案便是走强制索引,结果如图,查询只需要0.4s即可
第二种方案:因为使用group by的同时再用limit,会将所有数据进行扫描重排,导致效率差;所以只需将group by和limit隔离使用,如下图所示,将原来需要查询的结果作为子查询,再对查询结果使用limit限制,查询效率也是0.4s左右
总结:1.使用强制索引 2. 将group by 和 limit 隔离使用
来源地址:https://blog.csdn.net/qq_33492197/article/details/124689420