sql中的连接查询分为3种, cross join,inner join,和outer join ,  在 cross join和inner join中,筛选条件放在on后面还是where后面是没区别的,极端一点,在编写这两种连接查询的时候,只用on不使用where也没有什么问题。因此,on筛选和where筛选的差别只是针对outer join,也就是平时最常使用的left join和right join。 

1, cross join,inner join,和outer join

现有两张表,A 是左边的表。B 是右边的表。其各有四条记录,其中有两条记录name是相同的:

  

1) CROSS JOIN 把表A和表B的数据进行一个N*M的组合,即笛卡尔积。如本例会产生4*4=16条记录,在开发过程中我们肯定是要过滤数据,所以这种很少用。

SELECT * FROM a CROSS JOIN b

结果如下:

当然 CROSS JOIN可以加on条件

SELECT * FROM a CROSS JOIN b ON a.name = b.name 

结果:

2)inner join 如果和上面CROSS join一样不加on的话会报错,所以一般用来求交集

SELECT * FROM a INNER JOIN b ON a.name = b.name 

3)outer join 也必须加过滤条件,否则报错。

SELECT * FROM a LEFT OUTER JOIN b ON a.name = b.name 

结果,产生表A的完全集

SELECT * FROM a RIGHT OUTER JOIN b ON a.name = b.name 

结果产生表B的完全集

对比说明: 
  cross join生成时是先生成笛卡尔集,然后on连接条件被视为了filter用于数据过滤,inner join是直接基于join condition做连接,生成的join集合就是最终的输出结果,产生的中间数据更小。实际上MySQL优化器会将这两条查询都优化成同一种join方式,比如merge join或者nested loop join,如果你没有开启对应的优化参数,那么MySQL只有傻傻的去按指定的方式去做join。
  cross join  加on语法可以视作等同于inner join  on,不加on时则为求取笛卡尔积,其他left,right,inner必须加on    full join在mysql中不支持
 

2,outer join时的on和where的区别。

  数据库在通过连接两张或多张表来返回记录时,都会生成一张中间的临时表,然后再将这张临时表返回给用户。

  在使用left jion时,on和where条件的区别如下:

  1. on条件是在生成临时表时使用的条件,它不管on中的条件是否为真,都会返回左边表中的记录。
  2. where条件是在临时表生成好后,再对临时表进行过滤的条件。这时已经没有left join的含义(left join是必须返回左边表的记录),条件不为真的就全部过滤掉。

表一:tab1

表二:tab2

两条SQL:

  1. select * form tab1 left join tab2 on (tab1.size = tab2.size) where tab2.name=’AAA’
  2. select * form tab1 left join tab2 on (tab1.size = tab2.size and tab2.name=’AAA’)

  其实以上结果的关键原因就是left join,right join,full join的特殊性,不管on上的条件是否为真都会返回left或right表中的记录,full则具有left和right的特性的并集。 而inner jion没这个特殊性,则条件放在on中和where中,返回的结果集是相同的。

on、where、having的区别

  on、where、having这三个都可以加条件的子句中,on是最先执行,where次之,having最后。有时候如果这先后顺序不影响中间结果的话,那最终结果是相同的。但因为on是先把不符合条件的记录过滤后才进行统计(可以简化中间表),它就可以减少中间运算要处理的数据,按理说应该速度是最快的。

  在两个表联接时才用on的,所以在一个表的时候,就剩下where跟having比较了。在这单表查询统计的情况下,如果要过滤的条件没有涉及到要计算字段,那它们的结果是一样的,只是where可以使用rushmore技术,而having就不能,在速度上后者要慢。

  如果要涉及到计算的字段,就表示在没计算之前,这个字段的值是不确定的,根据上篇写的工作流程,where的作用时间是在计算之前就完成的,而having就是在计算后才起作用的,所以在这种情况下,两者的结果会不同。

  在多表联接查询时,on比where更早起作用。系统首先根据各个表之间的联接条件,把多个表合成一个临时表后,再由where进行过滤,然后再计算,计算完后再由having进行过滤。由此可见,要想过滤条件起到正确的作用,首先要明白这个条件应该在什么时候起作用,然后再决定放在那里

转自:https://www.cnblogs.com/sky6699/p/5238584.html

最新文章

  1. memcached(二)事件模型源码分析
  2. paip . 解决spring No unique bean of type [com.mijie.homi.search.service.index.MoodUserIndexService]
  3. Dom4j
  4. 如何在Fedora 22上面配置Apache的Docker容器
  5. java中调用dll文件的两种方法
  6. 最新版postgresql+pgboucer安装
  7. nyoj 710 外星人的供给站【贪心区间选点】
  8. 用程序对hdfs进行操作。
  9. Myeclipse代码提示及如何设置自动提示
  10. JAVA进阶----ThreadPoolExecutor机制(转)
  11. c编译器字节对齐指令
  12. 动态规划——Burst Ballons
  13. 【Java】利用注解和反射实现一个"低配版"的依赖注入
  14. 一些优秀的Python包
  15. python第六十天-----RabbitMQ
  16. poj2987 求最大权闭合回路
  17. android设备如何进入深度休眠还能继续使用定时器【求解】
  18. R语言通过loess去除某个变量对数据的影响--CNV分析
  19. 子序列的按位或 Bitwise ORs of Subarrays
  20. PE文件结构解析

热门文章

  1. Python docs
  2. C#--二维码生成代码
  3. UVa 170 - Clock Patience
  4. 杂项:ExtJS
  5. HTML iframe 和 frameset 的区别
  6. Docker私服仓库Harbor安装
  7. 关于SqlBulkCopy的测试
  8. 跟着8张思维导图学习javascript (转)
  9. solarwind之network Atlas
  10. 关于优化for循环的注意的事项