SQL调优--表统计信息未及时更新导致查询超级慢

栏目: 数据库 · 发布时间: 8年前

内容简介：默认情况下，查询优化器已根据需要更新统计信息以改进查询计划；但在某些情况下，你可以通过使用 UPDATE STATISTICS 或存储过程 sp_updatestats 来比默认更新更频繁地更新统计信息，提高查询性能。

某日同事丢给我一个看上去复杂的查询（实际就涉及两张表，套来套去）说只是换了日期条件，但一个查询5秒出数据，一个根本查不出来。现在整理下解决过程，及涉及的知识点。

若有不正之处，请多多谅解并欢迎批评指正，不甚感激。

一.问题描述

环境：sqlserver 2008r2

现象：

查询涉及到两张表

ODS_TABLE_A 每日数据700万现在总计60多亿。已建立索引+分区

MID_TABLE_B 每日数据20万总计3000万。已建立索引未分区

当etldate为 ‘2016-08-12’ 及以前的时间时，本查询5秒出数据，

当etldate为 ‘2016-08-16’ 及以后的时间时，本查询出不来数据。

贴上问题sql：做过数据字段处理，针对本篇主题注意点放在查询因为日期的选择不同导致查询时间变的超级慢，而不是改变 sql 写法比如用临时表，强制索引上。

———-《代码开始》

select 

COUNT(distinct(case when COL_USERID3 is null then COL_USERID6 end)) as 'aa',

COUNT(distinct(case when COL_USERID3 is null and COL_USERID7 is not null then COL_USERID6 end)) as 'bb',

COUNT(distinct(case when COL_USERID3 is not null then COL_USERID6 end)) as 'cc',

COUNT(distinct(case when COL_USERID3 is not null and COL_USERID7 is not null then COL_USERID6 end)) as 'dd',

SUM(case when COL_USERID3 IS not null then ee end) as 'ee'

from

(

    select c.COL_USERID3,c.ee,g.COL_USERID6

    from

    (

        select  b.COL_USERID2 as COL_USERID3,COUNT(b.COL_USERID2) as ee

        from

        (

            select COL_USERID as COL_USERID1,min(EventTime) as time1

                from ODS_TABLE_A    

                where  EtlDate = '2016-08-12'

                    and colid LIKE 'heihei%'

                    group by COL_USERID
 
        )as a
         join
        (
            select COL_USERID as COL_USERID2,eventtime as time2

                from ODS_TABLE_A  

                where EtlDate = '2016-08-12'

                    and ItemId = '1111111111101'

                    and colid like 'haha-%'

                    and colid not like 'haha-skill%'

                    and colid not like 'haha-fine%'

        )as b 

        on a.COL_USERID1 = b.COL_USERID2 and  a.time1 > b.time2

        group by b.COL_USERID2

    )as c
    right join
    (

        select  DISTINCT d.COL_USERID4 as COL_USERID6

        from

        (        
            select distinct COL_USERID as COL_USERID4

            from MID_TABLE_B     

            where etldate = '2016-08-12' 

        )as d

        join

        (
            select COL_USERID AS COL_USERID5

            from ODS_TABLE_A  

            where  EtlDate = '2016-08-12'

                and colid LIKE 'heihei%'

        )as f 

        on d.COL_USERID4 = f.COL_USERID5

    )as g

    on c.COL_USERID3 = g.COL_USERID6

)as i

left join
(
    select COL_USERID as COL_USERID7

    from MID_TABLE_B

    where EtlDate = '2016-08-12' 

        and IsTodayPay = '1'

)as h

on i.COL_USERID6 = h.COL_USERID7

100

101

102

103

104

105

106

107

108

109

110

111

112

select

COUNT(distinct(case when COL_USERID3 is null then COL_USERID6 end)) as 'aa',

COUNT(distinct(case when COL_USERID3 is null and COL_USERID7 is not null then COL_USERID6 end)) as 'bb',

COUNT(distinct(case when COL_USERID3 is not null then COL_USERID6 end)) as 'cc',

COUNT(distinct(case when COL_USERID3 is not null and COL_USERID7 is not null then COL_USERID6 end)) as 'dd',

SUM(case when COL_USERID3 IS not null then ee end) as 'ee'

from

(

select c.COL_USERID3,c.ee,g.COL_USERID6

from

(

select b.COL_USERID2 as COL_USERID3,COUNT(b.COL_USERID2) as ee

from

(

select COL_USERID as COL_USERID1,min(EventTime) as time1

from ODS_TABLE_A

where EtlDate = '2016-08-12'

and colid LIKE 'heihei%'

group by COL_USERID

)as a

join

(

select COL_USERID as COL_USERID2,eventtime as time2

from ODS_TABLE_A

where EtlDate = '2016-08-12'

and ItemId = '1111111111101'

and colid like 'haha-%'

and colid not like 'haha-skill%'

and colid not like 'haha-fine%'

)as b

on a.COL_USERID1 = b.COL_USERID2 and a.time1 > b.time2

group by b.COL_USERID2

)as c

right join

(

select DISTINCT d.COL_USERID4 as COL_USERID6

from

(

select distinct COL_USERID as COL_USERID4

from MID_TABLE_B

where etldate = '2016-08-12'

)as d

join

(

select COL_USERID AS COL_USERID5

from ODS_TABLE_A

where EtlDate = '2016-08-12'

and colid LIKE 'heihei%'

)as f

on d.COL_USERID4 = f.COL_USERID5

)as g

on c.COL_USERID3 = g.COL_USERID6

)as i

left join

(

select COL_USERID as COL_USERID7

from MID_TABLE_B

where EtlDate = '2016-08-12'

and IsTodayPay = '1'

)as h

on i.COL_USERID6 = h.COL_USERID7

———-《代码结束》

二。解决过程

1.先看了下上述代码的执行计划如下图初看上去需要用索引的地方都用到了。应该没啥大问题。

可能你注意到系统提示的缺少索引信息，加上去一样效果，不能解决‘2016-08-16’ 查询慢的问题。

SQL调优--表统计信息未及时更新导致查询超级慢

2.在修改下日期，就是把【所有】 etldate=‘2016-08-12’ 的改成 etldate=‘2016-08-16’

看下执行计划：对不起跑了半个小时没出来，查看估计的执行执行和上面的图类似。
减少涉及到数据集的量加top 1 我再看执行计划：
不贴图了结果就是比上面的图少了个【并行度】

初步以为是优化器因为估计行数等不准的原因没选择并行度，赶紧找代码让它强行这样走。
找到一篇宋大师的：强制SQL Server执行计划使用并行提升在复杂查询语句下的性能
http://www.cnblogs.com/CareySon/p/3851113.html

二话不说加关键字OPTION(querytraceon 8649)，可是应用到实际发现查询效率无任何改善，久久不出结果。后来问宋大师（感谢宋大神）。他说有些操作是没法并行的，更新统计信息试试先。

执行如下代码：
update STATISTICS ODS_TABLE_A –（把ODS_TABLE_A 这个大表统计信息更新）

默认情况下，查询优化器已根据需要更新统计信息以改进查询计划；但在某些情况下，你可以通过使用 UPDATE STATISTICS 或存储过程 sp_updatestats 来比默认更新更频繁地更新统计信息，提高查询性能。针对文中此种情况新插入的数据没统计信息，大表自动更新统计信息触发自动更新机制频率不够，最好定期更新。

关于update STATISTICS 就不累述了：给出相关技术贴连接
更新统计相关知识点传送门：https://msdn.microsoft.com/zh-cn/library/ms187348.aspx
至此问题解决。

三、总结

对于大表新插入的数据没及时更新统计信息，导致出现上面文中的现象，一个日期导致查询效率天壤之别的分水岭（查12号前5秒出数据，查12号后死活不出来。）

解决办法是大表自动更新统计信息触发自动更新机制频率不够，定期更新。

原文出处：一百零七个

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络，本站转载出于传递更多信息之目的，版权归原作者或者来源机构所有，如转载稿涉及版权问题，请联系我们。

码农书籍

计算机视觉

Richard Szeliski / 艾海舟、兴军亮 / 清华大学出版社 / 2012-1 / 109.00元

《计算机视觉——算法与应用》探索了用于分析和解释图像的各种常用技术，描述了具有一定挑战性的视觉应用方面的成功实例，兼顾专业的医学成像和图像编辑与交织之类有趣的大众应用，以便学生能够将其应用于自己的照片和视频，从中获得成就感和乐趣。本书从科学的角度介绍基本的视觉问题，将成像过程的物理模型公式化，然后在此基础上生成对场景的逼真描述。作者还运用统计模型来分析和运用严格的工程方法来解决这些问题。本......一起来看看《计算机视觉》这本书的介绍吧!

码农工具

SQL调优--表统计信息未及时更新导致查询超级慢

一.问题描述

二。解决过程

三、总结

计算机视觉

JSON 在线解析

RGB CMYK 转换工具

HSV CMYK 转换工具