SQL编写规范36条

以后可能还会增多，也可以考虑做一下减法。

去掉不必要的括号

如：      ((a AND b) AND c OR (((a AND b) AND (c AND d)))) 
修改成    (a AND b AND c) OR (a AND b AND c AND d)

去掉重叠常量

如：      (a<b AND b=c) AND a=5
修改成    b>5 AND b=c AND a=5

去除常量条件(由于常量重叠需要)

如：      (B>=5 AND B=5) OR (B=6 AND 5=5) OR (B=7 AND 5=6)
修改成    B=5 OR B=6

**郑松华**注解 ：但是必须注意 or 两边必须用括号括起来，不然会导致结果不一致

去掉无意义的连接用条件

如：1=1，2>1，1<2等   直接从

子句中去掉。
**郑松华**注解 ：但是对于1=1 有可能是开发为了动态添加sql 标准化而写 
如 select * from emp where 1=1 and emp_no=10001 and ….  这样后面都是and 开始

开发过程中不使用拼字符串的方式来完成where子句

多使用等值操作，少使用非等值操作

WHERE条件中的非等值条件（IN、BETWEEN、<、<=、>、>=）会导致后面的条件使用不了索引，因为不能同时用到两个范围条件。
郑松华注解 ：对这条有疑问 因为一个sql 的一个表来说只分access 和 fiter 只要使用了相应的选择率好的索引过滤了大部分数据对后面
作为fiter 条件来说没有大问题

常数表优先，字典表或小表其次，大表最后

常数表指：空表或只有1行的表。与在一个PRIMARY KEY或UNIQUE索引的WHERE子句一起使用的表。如：
SELECT * FROM t WHERE primary_key=1;
SELECT * FROM t1,t2 WHERE t1.primary_key=1 AND t2.primary_key=t1.id;
字典表指：小数量的行。如：自定义的自增字段表，而不使用MySQL的AUTO_INCREMENT。
郑松华注解 ：SQL的执行计划是基于cost的 除非强制使用hint 所以无法控制
上面的可以改为 表的连接条件最好是查询结果集最少的为驱动表 后续表要有良好的索引

减少或避免临时表

如果有一个ORDER BY子句和不同的GROUP BY子句，或如果ORDER BY或GROUP BY包含联接队列中的第一个表之外的其它表的列，则创建一个临时表。
郑松华注解 ：这里说的临时表应该是执行计划中extra部分的 using temporary 和 using filesort 关键字

where子句中的数据扫描别跨越表的30%

比如：where primary_key <> 1或者primary_key not in(…)，这样跨表的数据肯定超过30%了。
      where status=1，其中1值非常少，主要是0值，比如一个表的记录删除用了一个状态位，而删除的记录又比较少。
郑松华注解 ：这个应该讲的是索引的选择率问题 ，如果是删除数据的话 大量删除考虑创建一个临时表 改表名的方法或者
分段删除的方法 最好不要一次性 进行大量删除

where子句中同一个表的不同的字段组合建议小于等于5组，否则考虑业务逻辑或分表
```
郑松华注解 ：只要有一个进行好的选择率的索引条件 有几个都无所谓
```
不使用is null或is not null，字段设计时建议not null，若麻烦可折中考虑给一默认值

使用like时，%不要放在首字符位置。

如果%必须放在首字符位置
郑松华注解 ：这是基于有索引而言，记住只是字符类型 如果是别的数据类型即使把%放在后面一样不能使用索引

值域比较多的表字段放在前面

比如：id，date字段放在前面，而status这样的字段放在后面，具体的可以通过执行计划来把握。
郑松华注解 ：不知道作者想表达意思 ？ 如果是SQL中的select 列中的话 上面的没有关系 因为只跟是否回表有关系
@松华，主要是想表达，把过滤性好的条件放在联合索引的前面，这样过滤效果会更好些。
8.0的 skip index scan 可以反过来用，但是它的局限性很大，需要不能回表等等

表字段组合中出现比较多的表字段放在前面

方便综合评估索引，缓解因为索引过多导致的增删改的一些性能问题。

表字段不能有表达式或是函数

如：where abs(列)>3或where 列*10>100
郑松华注解 ：这是基于该列有索引 如果使用上述方法会导致不能使用索引
5.6的时候 是没有办法的
5.7的时候 可以使用虚拟列
8.0开始 支持函数索引

注意表字段的类型，避免表字段的隐示转换

比如：c1列为varchar，如果where c1=1，建议后面整数类型的值加上引号，例如：where c1='1'。
郑松华注解：如上面的情况之后 额外注意 表或者数据库的字符集，例如列的数据类型是一样的 但是表或者数据库的字符集不一致的话 也会出现
隐士转换

考虑使用union all，少使用union，注意考虑去重

union all不去重，而少了排序操作，速度相对比union要快，如果没有去重的需求，优先使用union all。
郑松华注解 ：MySQL 5.6和5.7对union all 的执行计划是不一样的注意把握 5.6的union all 跟union 一样 在执行计划中会产生 <union reslut> 
会在内存中使用临时表 ，而extra部分不出现using temp相关的提示，使用内存临时表就跟
数据库的tmp table size 和 heap size 有关。

不同字段的值or或in大于等于3次，考虑用union all替换；同一字段的值or用in替换

Select * from opp WHERE phone=‘12347856' or phone=‘42242233';
考虑用
Select * from opp WHERE phone in ('12347856' , '42242233');

Select * from opp WHERE phone='010-88886666' or cellPhone='13800138000'; 
考虑用
Select * from opp WHERE phone='010-88886666' 
union all
Select * from opp WHERE cellPhone='13800138000';
郑松华注解 ：MySQL 5.6 和5.7当中对in 的处理机制有点不一样 注意把握
尤其是 不同的列的or 条件的时候 有可能一个索引满足不了 ，这时候 需要union all 分开来满足不同的索引

用Where子句替换HAVING子句

select id,count(*) from table group by id having age>=30 order by null;
考虑用
select id,count(*) from table where age>=30 group by id order by null;
郑松华注解：上面的第一个sql 本身就不严谨 有可能出现执行计划不同结果不同

对同一表的order by和group by操作分别小于3组，否则考虑业务逻辑或分表
尽量使用主键进行update和delete
小心text/blobs等大字段，如果确实不需要这样的大字段，则不用放入sql语句中，避免产生过多额外I/O读。
```
郑松华注解：有可能产生行链接问题，还有排序的时候产生大量消耗
```
使用INSERT ... ON DUPLICATE KEY update (INSERT IGNORE)来避免不必要的查询
limit N以及limit M,N场景中，不管是M还是N的值都不宜过大（一般不超过一万）。当M（起始值）较大时，建议用延迟关联的方式优化，例如：

SELECT * FROM (SELECT * FROM `t1` WHERE id > ( SELECT id FROM `t1` ORDER BY id DESC LIMIT 935510, 1) LIMIT 10) t ORDER BY id DESC;

或
SELECT * FROM `t1` INNER JOIN ( SELECT id FROM `t1`ORDER BY id DESC LIMIT 935500,10) t2 USING (id);

减少或避免排序，如：group by语句中如果不需要排序，可以增加order by null

郑松华注解：8.0 之前有group by 是有排序的 但是8.0开始 group by 没有排序
但是如果group by 的列是索引的前导列 那么还是有排序的，但是extra部分是没有using file sort

增删改语句中不使用不确定值函数和随机函数，如：RAND()和SYSDATE()等。

郑松华注解：如果非得 使用， 需要提前进行一次子查询 查询使它固定，然后以调用的形式使用

INSERT语句使用batch提交（INSERT INTO table VALUES(),(),()„„），values的个数不超过500。
避免使用存储过程、触发器、函数、UDF、events等，容易将业务逻辑和DB耦合在一起，并且MySQL的存储过程、触发器、函数、UDF、events中存在一定的bug。
避免使用超过3次的JOIN查询。

使用合理的SQL语句减少与数据库的交互次数。

INSERT ... ON DUPLICATE KEY UPDATE
REPLACE INTO、INSERT IGNORE 、INSERT INTO VALUES(),(),()
UPDATE … WHERE ID IN(10,20,50,…)

减少使用视图，避免复杂的语句。

郑松华注解：视图有可能导致 外部参数进不去的情况 这样会导致sql 运行缓慢
mysql 视图创建的时候 有两个选项，大家查阅不同之处 然后根据实际情况使用

SQL语句中IN包含的值尽量不超过200个。

郑松华注解： in 在5.6 和5.7 有不同之处 ，5.7对 隐士转换有一定的缓解
但是还是有问题 ，强调 where a in ( 1) 这种案例中 a 和 in () 里面的数据类型必须保持一致性，
且in 里面的所有值的数据类型也应保持一致。

UPDATE、DELETE语句不使用LIMIT(binlog格式是statement或是mixed格式时，容易造成主从不一致,binlog_format=row时，请忽略)。有主键id的表WHERE条件应结合主键。
使用prepared statement，可以提供性能并且避免SQL注入。
InnoDB表避免使用COUNT(*)操作，计数统计实时要求较强可以使用memcache或者redis，非实时统计可以使用单独统计表，定时更新。

禁止在Update语句，将“,”写成“and”，非常危险。

正确示例：update Table set uid=uid+1000,gid=gid+1000 where id <=2 ;
错误示例：update Table set uid=uid+1000 and gid=gid+1000 where id <=2 ;
此时“uid=uid+1000 and gid=gid+1000”将作为值赋给uid，并且无Warning！！！

37 update 语句禁止使用 in ,exists等尽量使用 join

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

sql_write_note.md

sql_write_note.md

SQL编写规范36条

Files

sql_write_note.md

Latest commit

History

sql_write_note.md

File metadata and controls

SQL编写规范36条