数据库的多表大数据查询应如何优化？

 我来答

1个回答

#热议# 上班途中天气原因受伤算工伤吗？

刺任芹O
2022-11-16 · TA获得超过6.2万个赞

知道顶级答主

回答量：38.7万

采纳率：99%

帮助的人：8576万

我也去答题访问个人页

关注

展开全部

1.应尽量避免在 where 子句中对字段进行 null 值判断，否则将导致引擎放弃使用索引而进行全表扫描，如：\x0d\x0aselect id from t where num is null\x0d\x0a可以在num上设置默认值0，确保表中num列没有null值，然后这样查询：\x0d\x0aselect id from t where num=0\x0d\x0a2.应尽量避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描。优化器将无法通过索引来确定将要命中的行数,因此需要搜索该表的所有行。\x0d\x0a3.应尽量避免在 where 子句中使用 or 来连接条件，否则将导致引擎放弃使用索引而进行全表扫描，如：\x0d\x0aselect id from t where num=10 or num=20\x0d\x0a可以这样查询：\x0d\x0aselect id from t where num=10\x0d\x0aunion all\x0d\x0aselect id from t where num=20\x0d\x0a4.in 和 not in 也要慎用，因为IN会使系统无法使用索引,而只能直接搜索表中的数据。如：\x0d\x0aselect id from t where num in(1,2,3)\x0d\x0a对于连续的数值，能用 between 就不要用 in 了：\x0d\x0aselect id from t where num between 1 and 3\x0d\x0a5.尽量避免在索引过的字符数据中，使用非打头字母搜索。这也使得引擎无法利用索引。 \x0d\x0a见如下例子： \x0d\x0aSELECT * FROM T1 WHERE NAME LIKE ‘%L%’ \x0d\x0aSELECT * FROM T1 WHERE SUBSTING(NAME,2,1)=’L’ \x0d\x0aSELECT * FROM T1 WHERE NAME LIKE ‘L%’ \x0d\x0a即使NAME字段建有索引，前两个查询依然无法利用索引完成加快操作，引擎不得不对全表所有数据逐条操作来完成任务。而第三个查询能够使用索引来加快操作。\x0d\x0a6.必要时强制查询优化器使用某个索引，如在 where 子句中使用参数，也会导致全表扫描。因为SQL只有在运行时才会解析局部变量，但优化程序不能将访问计划的选择推迟到运行时；它必须在编译时进行选择。然而，如果在编译时建立访问计划，变量的值还是未知的，因而无法作为索引选择的输入项。如下面语句将进行全表扫描：\x0d\x0aselect id from t where num=@num\x0d\x0a可以改为强制查询使用索引：\x0d\x0aselect id from t with(index(索引名)) where num=@num\x0d\x0a7.应尽量避免在 where 子句中对字段进行表达式操作，这将导致引擎放弃使用索引而进行全表扫描。如：\x0d\x0aSELECT * FROM T1 WHERE F1/2=100 \x0d\x0a应改为: \x0d\x0aSELECT * FROM T1 WHERE F1=100*2\x0d\x0aSELECT * FROM RECORD WHERE SUBSTRING(CARD_NO,1,4)=’5378’ \x0d\x0a应改为: \x0d\x0aSELECT * FROM RECORD WHERE CARD_NO LIKE ‘5378%’\x0d\x0aSELECT member_number, first_name, last_name FROM members \x0d\x0aWHERE DATEDIFF(yy,datofbirth,GETDATE()) > 21 \x0d\x0a应改为: \x0d\x0aSELECT member_number, first_name, last_name FROM members \x0d\x0aWHERE dateofbirth < DATEADD(yy,-21,GETDATE()) \x0d\x0a即：任何对列的操作都将导致表扫描，它包括数据库函数、计算表达式等等，查询时要尽可能将操作移至等号右边。\x0d\x0a8.应尽量避免在where子句中对字段进行函数操作，这将导致引擎放弃使用索引而进行全表扫描。如：\x0d\x0aselect id from t where substring(name,1,3)='abc'--name以abc开头的id\x0d\x0aselect id from t where datediff(day,createdate,'2005-11-30')=0--‘2005-11-30’生成的id\x0d\x0a应改为:\x0d\x0aselect id from t where name like 'abc%'\x0d\x0aselect id from t where createdate>='2005-11-30' and createdate<'2005-12-1'\x0d\x0a9.不要在 where 子句中的“=”左边进行函数、算术运算或其他表达式运算，否则系统将可能无法正确使用索引。\x0d\x0a10.在使用索引字段作为条件时，如果该索引是复合索引，那么必须使用到该索引中的第一个字段作为条件时才能保证系统使用该索引，否则该索引将不会被使用，并且应尽可能的让字段顺序与索引顺序相一致。\x0d\x0a11.很多时候用 exists是一个好的选择：\x0d\x0aelect num from a where num in(select num from b)\x0d\x0a用下面的语句替换：\x0d\x0aselect num from a where exists(select 1 from b where num=a.num)\x0d\x0aSELECT SUM(T1.C1)FROM T1 WHERE( \x0d\x0a(SELECT COUNT(*)FROM T2 WHERE T2.C2=T1.C2>0) \x0d\x0aSELECT SUM(T1.C1) FROM T1WHERE EXISTS( \x0d\x0aSELECT * FROM T2 WHERE T2.C2=T1.C2) \x0d\x0a两者产生相同的结果，但是后者的效率显然要高于前者。因为后者不会产生大量锁定的表扫描或是索引扫描。