数据库内外连接讲解

发表于:2016-9-06 10:19

字体: | 上一篇 | 下一篇 | 我要投稿

 作者:晨港飞燕    来源:51Testing软件测试网采编

  概述
  1、内联接(典型的联接运算,使用像 = 或 <> 之类的比较运算符)。包括相等联接和自然联接。
  内联接使用比较运算符根据每个表共有的列的值匹配两个表中的行。例如,检索 students和courses表中学生标识号相同的所有行。
  2、外联接。外联接可以是左向外联接、右向外联接或完整外部联接。
  在 FROM子句中指定外联接时,可以由下列几组关键字中的一组指定:
  1)LEFT JOIN或LEFT OUTER JOIN
  左向外联接的结果集包括 LEFT OUTER子句中指定的左表的所有行,而不仅仅是联接列所匹配的行。如果左表的某行在右表中没有匹配行,则在相关联的结果集行中右表的所有选择列表列均为空值。
  2)RIGHT JOIN 或 RIGHT OUTER JOIN
  右向外联接是左向外联接的反向联接。将返回右表的所有行。如果右表的某行在左表中没有匹配行,则将为左表返回空值。
  3)FULL JOIN 或 FULL OUTER JOIN
  完整外部联接返回左表和右表中的所有行。当某行在另一个表中没有匹配行时,则另一个表的选择列表列包含空值。如果表之间有匹配行,则整个结果集行包含基表的数据值。
  例子:
  -------------------------------------------------
  a表 id name  b表 id job parent_id
  1 张3 1 23 1
  2 李四 2 34 2
  3 王武 3 34 4
  a.id同parent_id 存在关系
  --------------------------------------------------
  1) 内连接
  select a.*,b.* from a inner join b on a.id=b.parent_id
  结果是
  1 张3 1 23 1
  2 李四 2 34 2
  2)左连接
  select a.*,b.* from a left join b ona.id=b.parent_id
  结果是
  1 张3 1 23 1
  2 李四 2 34 2
  3 王武 null
  3) 右连接
  select a.*,b.* from a right join b on a.id=b.parent_id
  结果是
  1 张3 1 23 1
  2 李四 2 34 2
  null 3 34 4
  4) 完全连接 (不做过多概述)
  select a.*,b.* from a full join b on a.id=b.parent_id
  结果是
  1 张3 1 23 1
  2 李四 2 34 2
  null    3 34 4
  3 王武 null
  内连接(INNER JOIN)
  内连接(INNERJOIN):有两种,显式的和隐式的,返回连接表中符合连接条件和查询条件的数据行。(所谓的链接表就是数据库在做查询形成的中间表)。
  例如:下面的语句3和语句4的结果是相同的。
  语句1:隐式的内连接,没有INNER JOIN,形成的中间表为两个表的笛卡尔积。
  SELECTO.ID,O.ORDER_NUMBER,C.ID,C.NAME
  FROM CUSTOMERS C,ORDERS O
  WHERE C.ID=O.CUSTOMER_ID;
  语句2:显示的内连接,一般称为内连接,有INNER JOIN,形成的中间表为两个表经过ON条件过滤后的笛卡尔积。
  SELECTO.ID,O.ORDER_NUMBER,C.ID,C.NAME
  FROM CUSTOMERS C INNER JOIN ORDERS O ON C.ID=O.CUSTOMER_ID;
  外连接(OUTER JOIN):
  外连不但返回符合连接和查询条件的数据行,还返回不符合条件的一些行。外连接分三类:左外连接(LEFT OUTER JOIN)、右外连接(RIGHT OUTER JOIN)和全外连接(FULL OUTER JOIN)。
  三者的共同点是都返回符合连接条件和查询条件(即:内连接)的数据行。不同点如下:
  左外连接还返回左表中不符合连接条件单符合查询条件的数据行。
  右外连接还返回右表中不符合连接条件单符合查询条件的数据行。
  全外连接还返回左表中不符合连接条件单符合查询条件的数据行,并且还返回右表中不符合连接条件单符合查询条件的数据行。全外连接实际是上左外连接和右外连接的数学合集(去掉重复),即“全外=左外 UNION 右外”。
  说明:左表就是在“(LEFT OUTER JOIN)”关键字左边的表。右表当然就是右边的了。在三种类型的外连接中,OUTER 关键字是可省略的。
  下面举例说明:
  语句3:左外连接(LEFTOUTER JOIN)
  SELECTO.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME
  FROM ORDERS O LEFT OUTER JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID;
  语句4:右外连接(RIGHT OUTER JOIN)
  SELECTO.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME
  FROM ORDERS O RIGHT OUTER JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID;
  注意:WHERE条件放在ON后面查询的结果是不一样的。例如:
  语句5:WHERE条件独立。
  SELECTO.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME
  FROM ORDERS O LEFT OUTER JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID
  WHERE O.ORDER_NUMBER<>'MIKE_ORDER001';
  语句6:将语句5中的WHERE条件放到ON后面。
  SELECTO.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME
  FROM ORDERS O LEFT OUTER JOIN CUSTOMERS C ONC.ID=O.CUSTOMER_ID AND O.ORDER_NUMBER<>'MIKE_ORDER001';
  从语句5和语句6查询的结果来看,显然是不相同的,语句6显示的结果是难以理解的。因此,推荐在写连接查询的时候,ON后面只跟连接条件,而对中间表限制的条件都写到WHERE子句中。
  语句7:全外连接(FULLOUTER JOIN)。
  SELECTO.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME
  FROM ORDERS O FULL OUTER JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID;
  注意:MySQL是不支持全外的连接的,这里给出的写法适合Oracle和DB2。但是可以通过左外和右外求合集来获取全外连接的查询结果。
  语句8:左外和右外的合集,实际上查询结果和语句7是相同的。
  SELECTO.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME
  FROM ORDERS O LEFT OUTER JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID
  UNION
  SELECT O.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME
  FROM ORDERS O RIGHT OUTER JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID;
  SQL查询的基本原理:两种情况介绍。
  第一、单表查询:根据WHERE条件过滤表中的记录,形成中间表(这个中间表对用户是不可见的);然后根据SELECT的选择列选择相应的列进行返回最终结果。
  第二、两表连接查询:对两表求积(笛卡尔积)并用ON条件和连接连接类型进行过滤形成中间表;然后根据WHERE条件过滤中间表的记录,并根据SELECT指定的列返回查询结果。
  第三、多表连接查询:先对第一个和第二个表按照两表连接做查询,然后用查询结果和第三个表做连接查询,以此类推,直到所有的表都连接上为止,最终形成一个中间的结果表,然后根据WHERE条件过滤中间表的记录,并根据SELECT指定的列返回查询结果。
  理解SQL查询的过程是进行SQL优化的理论依据。
  ON后面的条件(ON条件)和WHERE条件的区别:
  ON条件:是过滤两个链接表笛卡尔积形成中间表的约束条件。
  WHERE条件:在有ON条件的SELECT语句中是过滤中间表的约束条件。在没有ON的单表查询中,是限制物理表或者中间查询结果返回记录的约束。在两表或多表连接中是限制连接形成最终中间表的返回结果的约束。
  从这里可以看出,将WHERE条件移入ON后面是不恰当的。推荐的做法是:
  ON只进行连接操作,WHERE只过滤中间表的记录。
  总结
  连接查询是SQL查询的核心,连接查询的连接类型选择依据实际需求。如果选择不当,非但不能提高查询效率,反而会带来一些逻辑错误或者性能低下。下面总结一下两表连接查询选择方式的依据:
  1、 查两表关联列相等的数据用内连接。
  2、 Col_L是Col_R的子集时用右外连接。
  3、 Col_R是Col_L的子集时用左外连接。
  4、 Col_R和Col_L彼此有交集但彼此互不为子集时候用全外。
  多个表查询的时候,这些不同的连接类型可以写到一块。例如:
  SELECT T1.C1,T2.CX,T3.CY
  FROM TAB1 T1
  INNER JOIN TAB2 T2 ON (T1.C1=T2.C2)
  INNER JOIN TAB3 T3 ON (T1.C1=T2.C3)
  LEFT OUTER JOIN TAB4 ON(T2.C2=T3.C3);
  WHERE T1.X >T3.Y;
  上面这个SQL查询是多表连接的一个示范。
  操作符下的左右连接
  对于外连接, 也可以使用“(+) ”来表示。 关于使用(+)的一些注意事项:
  1.(+)操作符只能出现在where子句中,并且不能与outer join语法同时使用。
  2. 当使用(+)操作符执行外连接时,如果在where子句中包含有多个条件,则必须在所有条件中都包含(+)操作符
  3.(+)操作符只适用于列,而不能用在表达式上。
  4.(+)操作符不能与or和in操作符一起使用。
  5.(+)操作符只能用于实现左外连接和右外连接
  左连接
  用(+)来实现,这个+号可以这样来理解: + 表示补充,即哪个表有加号,这个表就是匹配表。所以加号写在右表,左表就是全部显示,故是左连接。
  SQL>Select * from dave a,bl b where a.id=b.id(+);    -- 注意: 用(+) 就要用关键字where
  右连接
  用(+)来实现,这个+号可以这样来理解:+ 表示补充,即哪个表有加号,这个表就是匹配表。所以加号写在左表,右表就是全部显示,故是右连接。
  SQL>Select * from dave a,bl b where a.id(+)=b.id;
  On与where的区别
  数据库在通过连接两张或多张表来返回记录时,都会生成一张中间的临时表,然后再将这张临时表返回给用户。
  在使用left jion时,on和where条件的区别如下:
  1、 on条件是在生成临时表时使用的条件,它不管on中的条件是否为真,都会返回左边表中的记录。
  2、where条件是在临时表生成好后,再对临时表进行过滤的条件。这时已经没有left join的含义(必须返回左边表的记录)了,条件不为真的就全部过滤掉。
  假设有两张表:
  表1:tab2 id size
  1 10
  2 20
  3 30
  表2:tab2size name
  10 AAA
  20 BBB
  20 CCC
  两条SQL:
  1、select* form tab1 left join tab2 on (tab1.size = tab2.size) where tab2.name=’AAA’
  2、select* form tab1 left join tab2 on (tab1.size = tab2.sizeandtab2.name=’AAA’)
  第一条SQL的过程:
  1、中间表
  on条件:
  tab1.size = tab2.size  tab1.id tab1.size tab2.size tab2.name
  1 10 10 AAA
  2 20 20 BBB
  2 20 20 CCC
  3 30 (null) (null)
  | |
  2、再对中间表过滤
  where 条件:
  tab2.name=’AAA’
  tab1.id tab1.size tab2.size tab2.name
  1 10 10 AAA
  第二条SQL的过程:
  1、中间表
  on条件:
  tab1.size = tab2.size and tab2.name=’AAA’
  (条件不为真也会返回左表中的记录) tab1.id tab1.size tab2.size tab2.name
  1 10 10 AAA
  2 20 (null) (null)
  3 30 (null) (null)
  其实以上结果的关键原因就是left join,right join,full join的特殊性,不管on上的条件是否为真都会返回left或right表中的记录,full则具有left和right的特性的并集。而inner jion没这个特殊性,则条件放在on中和where中,返回的结果集是相同的。
  心得:外链接匹配,内连接过滤,外链接即匹配又过滤用on和where搭配
《2023软件测试行业现状调查报告》独家发布~

关注51Testing

联系我们

快捷面板 站点地图 联系我们 广告服务 关于我们 站长统计 发展历程

法律顾问:上海兰迪律师事务所 项棋律师
版权所有 上海博为峰软件技术股份有限公司 Copyright©51testing.com 2003-2024
投诉及意见反馈:webmaster@51testing.com; 业务联系:service@51testing.com 021-64471599-8017

沪ICP备05003035号

沪公网安备 31010102002173号