在一次系统优化中,意外发现一个比较“坑”的SQL,拿出来供大家分享。

生成演示数据:

--======================================
--检查测试表是否存在
IF(OBJECT_ID('TB2002') IS NOT NULL)
BEGIN
DROP TABLE TB2002
END
GO
--============================
--生成测试数据并创建索引
SELECT
IDENTITY(INT,1,1) AS ID,
*
INTO TB2002
FROM sys.columns C
GO
CREATE UNIQUE CLUSTERED INDEX IDX_ID
ON TB2002
(
ID
)
GO
CREATE INDEX IDX_column_id
ON TB2002
(
column_id
)

执行查询:

SELECT TOP(100) *  FROM TB2002
WHERE column_id=1

上面查询虽然列column_id上有索引,但由于该列的选择性不高,查询优化引擎根据预估行数生成“使用表扫描”的执行计划:

针对此测试环境,表扫描的确是最优的查询方式,但生产环境中我们经常遇到此类问题,由于统计信息或预估行数导致执行计划不优的情况,通常我们需要通过改写SQL来“让”查询优化引擎生成我们期望的查询方式,因此我将查询SQL优化为:

WITH T1 AS (
SELECT TOP(100) ID AS RID FROM TB2002
WHERE column_id=1
)
SELECT* FROM TB2002 WITH(FORCESEEK)
WHERE ID IN (SELECT RID FROM T1)

查询生成的执行计划为:

查询先按照索引IDX_column_id来进行查找,再按照IDX_ID进行KEY LOOKUP,这样避免了“表扫描”操作。

当然以上都是是今天的重点,重点在于我手抖了,在优化过程中一不小心漏瞧了一个字母,于是悲剧粗线了。

漏敲一个字母的SQL为:

WITH T1 AS (
SELECT TOP(100) ID AS RID FROM TB2002
WHERE column_id=1
)
SELECT* FROM TB2002
WHERE ID IN (SELECT ID FROM T1)

生成执行计划为:

先不考虑执行计划中的红叉叉,查看返回数据,我们会发现“整表的数据被返回啦”,这是什么鬼?

理论上CTE的结果集中只有RID一列,那么SELECT ID FROM T1 这个子查询应该会执行失败,我们执行以下查询

WITH T1 AS (
SELECT TOP(100) ID AS RID FROM TB2002
WHERE column_id=1
)

执行会得到以下错误:

消息 207,级别 16,状态 1,第 5 行
列名 'ID' 无效。

但对那个漏敲一个字母的SQL,查询优化引擎“赤裸裸”地忽略掉这个错误,在Nested Loops运算时只有一个“No Join Predicate”的警告,Nested Loops操作描述为“对于顶部(外部)输入的每一行,扫描底部(内部)输入,然后输出匹配的行。”,查询进行表扫描,得到一个“整表数据”的结果集T1,然后准备对结果集T1中的每一行到“CTE的结果集”中进行匹配,由于“CTE的结果集”中没有ID列,于是“莫名其妙”地认为所有行都匹配上,将整表数据都返回啦。

就好比警察抓到了一帮人,打算“在逃罪犯”系统里依次匹配每个人是不是“逃犯”,结果“在逃罪犯”系统蓝屏了,于是抓到的这帮人全成了“逃犯”,通通拉出去死啦死啦滴,还能好好玩耍了么?

--=================================================================================

群里兄弟补充,在临时表里同样有类似问题:

测试代码:

SELECT  IDENTITY( INT,1,1 ) AS ID ,
*
INTO TB2002
FROM sys.columns C
GO
SELECT TOP 1
id AS ROWID
INTO #tmp
FROM TB2002
GO
SELECT *
FROM TB2002
WHERE id IN ( SELECT ID
FROM #tmp )

--=================================================================================

惨痛教训:由于优化的是DELETE 语句,本来想着通过CTE使用NOLOCK将满足条件的ID查找出来再按照ID进行删除,检查完过滤条件没有问题,直接执行导致整表数据被删除,幸好该操作没有影响业务,并有完整备份和日志备份,最终使用“指定时间点还原”+STANDBY的方式找回数据,但想想也是后怕!建议有类似习惯的童鞋在做此类操作时,先将DELETE 修改为SELECT,确保返回数据是要删除数据后,再执行DELETE。

--=================================================================================

照例是妹子镇贴和压惊

最新文章

  1. 扩展HT for Web之HTML5表格组件的Renderer和Editor
  2. JS中基本类型与包装类型的关系
  3. iOS XMPP Framework 中文概述
  4. c#调用js,以及js调用C#里的函数, c#自己生成js代码,实现对web的控制
  5. 《JavaScript 闯关记》之作用域和闭包
  6. 在borland c++ builder 中使用 google test (gtest)
  7. 避免循环做SQL操作
  8. appium----【已解决】【Mac】环境配置提示“Xcode Command Line Tools are NOT installed!"
  9. C#对Windows文件/文件夹/目录的一些操作总结
  10. vue的生命周期(lifecycle)
  11. 关于 CGI,Fastcgi和php-fpm 理解
  12. IDEA工具 常用的设置
  13. 使用IDEA远程部署tomcat和调试
  14. 带索引的tableView
  15. C#学习笔记-原型模式
  16. MySQL学习【第八篇索引优化】
  17. Python实现注册和三次验证登录
  18. Histogram
  19. 使用for循环打印9×9乘法表
  20. 【转】如约而至:微信自用的移动端IM网络层跨平台组件库Mars已正式开源

热门文章

  1. 从钉钉微应用定制化导航栏看如何实现Hydrid App开发框架
  2. Spring中常用的连接池配置
  3. 《构建高性能web站点》随笔 无处不在的性能问题
  4. Node.js的UnitTest单元测试
  5. mysql出错:Access denied for user 'root'@'localhost' (using password: YES)
  6. 粒子动画Particleground.js
  7. [Cordova] Plugin开发入门
  8. Visual Studio Code 使用 ESLint 增强代码风格检查
  9. css3中的前缀
  10. 12款免费的 WordPress 响应式主题下载