day14-组合查询
组合查询
多数 SQL 查询只包含从一个或多个表中返回数据的单条 SELECT 语句。
但是,SQL 也允许执行多个查询(多条 SELECT 语句),并将结果作为一个查询结果集返回。这些组合查询通常称为并(union)或复合查询(compound query)。
主要有两种情况需要使用组合查询:
在一个查询中从不同的表返回结构数据;
对一个表执行多个查询,按一个查询返回数据。
提示:组合查询和多个 WHERE 条件
多数情况下,组合相同表的两个查询所完成的工作与具有多个 WHERE子句条件的一个查询所完成的工作相同。换句话说,任何具有多个WHERE 子句的 SELECT 语句都可以作为一个组合查询,在下面可以看到这一点。
创建组合查询
可用 UNION 操作符来组合数条 SQL 查询。利用 UNION,可给出多条SELECT 语句,将它们的结果组合成一个结果集。
使用union
使用 UNION 很简单,所要做的只是给出每条 SELECT 语句,在各条语句之间放上关键字 UNION。
举个例子,假如需要 Illinois、Indiana 和 Michigan 等美国几个州的所有顾客的报表,还想包括不管位于哪个州的所有的 Fun4All。当然可以利用WHERE 子句来完成此工作,不过这次我们使用 UNION。
如上所述,创建 UNION 涉及编写多条 SELECT 语句。首先来看单条语句:
SELECT cust_name, cust_contact, cust_email
FROM Customers
WHERE cust_state IN ('IL','IN','MI');
输出:
mysql> SELECT cust_name, cust_contact, cust_email
-> FROM Customers
-> WHERE cust_state IN ('IL','IN','MI');
+---------------+--------------+---------------------------------+
| cust_name | cust_contact | cust_email |
+---------------+--------------+---------------------------------+
| Village Toys | John Smith | sales@villagetoys.com |
| Fun4All | Jim Jones | jjones@fun4all.com |
| The Toy Store | Kim Howard | NULL |
| Ben's Toys | NULL | ben@fortabbwpc.wpcomstaging.com |
+---------------+--------------+---------------------------------+
4 rows in set (0.01 sec)
mysql>
SELECT cust_name, cust_contact, cust_email
FROM Customers
WHERE cust_name = 'Fun4All';
输出:
mysql> SELECT cust_name, cust_contact, cust_email
-> FROM Customers
-> WHERE cust_name = 'Fun4All';
+-----------+--------------------+-----------------------+
| cust_name | cust_contact | cust_email |
+-----------+--------------------+-----------------------+
| Fun4All | Jim Jones | jjones@fun4all.com |
| Fun4All | Denise L. Stephens | dstephens@fun4all.com |
+-----------+--------------------+-----------------------+
2 rows in set (0.00 sec)
第一条 SELECT 把 Illinois、Indiana、Michigan 等州的缩写传递给 IN 子句,检索出这些州的所有行。第二条 SELECT 利用简单的相等测试找出所有Fun4All。你会发现有一条记录出现在两次结果里,因为它满足两次的条件。
组合这两条语句,可以如下进行:
SELECT cust_name, cust_contact, cust_email
FROM Customers
WHERE cust_state IN ('IL','IN','MI')
UNION
SELECT cust_name, cust_contact, cust_email
FROM Customers
WHERE cust_name = 'Fun4All';
输出:
mysql> SELECT cust_name, cust_contact, cust_email
-> FROM Customers
-> WHERE cust_state IN ('IL','IN','MI')
-> UNION
-> SELECT cust_name, cust_contact, cust_email
-> FROM Customers
-> WHERE cust_name = 'Fun4All';
+---------------+--------------------+---------------------------------+
| cust_name | cust_contact | cust_email |
+---------------+--------------------+---------------------------------+
| Village Toys | John Smith | sales@villagetoys.com |
| Fun4All | Jim Jones | jjones@fun4all.com |
| The Toy Store | Kim Howard | NULL |
| Ben's Toys | NULL | ben@fortabbwpc.wpcomstaging.com |
| Fun4All | Denise L. Stephens | dstephens@fun4all.com |
+---------------+--------------------+---------------------------------+
5 rows in set (0.00 sec)
mysql>
这条语句由前面的两条 SELECT 语句组成,之间用 UNION 关键字分隔。
UNION 指示 DBMS 执行这两条 SELECT 语句,并把输出组合成一个查询结果集。
为了便于参考,这里给出使用多条 WHERE 子句而不是 UNION 的相同查询:
SELECT cust_name, cust_contact, cust_email
FROM Customers
WHERE cust_state IN ('IL','IN','MI')
UNION
SELECT cust_name, cust_contact, cust_email
FROM Customers
WHERE cust_name = 'Fun4All';
输出:
mysql> SELECT cust_name, cust_contact, cust_email
-> FROM Customers
-> WHERE cust_state IN ('IL','IN','MI')
-> UNION
-> SELECT cust_name, cust_contact, cust_email
-> FROM Customers
-> WHERE cust_name = 'Fun4All';
+---------------+--------------------+---------------------------------+
| cust_name | cust_contact | cust_email |
+---------------+--------------------+---------------------------------+
| Village Toys | John Smith | sales@villagetoys.com |
| Fun4All | Jim Jones | jjones@fun4all.com |
| The Toy Store | Kim Howard | NULL |
| Ben's Toys | NULL | ben@fortabbwpc.wpcomstaging.com |
| Fun4All | Denise L. Stephens | dstephens@fun4all.com |
+---------------+--------------------+---------------------------------+
5 rows in set (0.00 sec)
在这个简单的例子中,使用 UNION 可能比使用 WHERE 子句更为复杂。但对于较复杂的过滤条件,或者从多个表(而不是一个表)中检索数据的情形,使用 UNION 可能会使处理更简单。
提示:UNION 的限制
使用 UNION 组合 SELECT 语句的数目,SQL 没有标准限制。但是,最好是参考一下具体的 DBMS 文档,了解它是否对 UNION 能组合的最大语句数目有限制。
注意:性能问题
多数好的 DBMS 使用内部查询优化程序,在处理各条 SELECT 语句前组合它们。理论上讲,这意味着从性能上看使用多条 WHERE 子句条件还是 UNION 应该没有实际的差别。不过我说的是理论上,实践中多数查询优化程序并不能达到理想状态,所以最好测试一下这两种方法,看哪种工作得更好。
union规则
可以看到,UNION 非常容易使用,但在进行组合时需要注意几条规则。
UNION 必须由两条或两条以上的 SELECT 语句组成,语句之间用关键字
UNION 分隔(因此,如果组合四条 SELECT 语句,将要使用三个 UNION关键字)。
UNION 中的每个查询必须包含相同的列、表达式或聚集函数(不过,各个列不需要以相同的次序列出)。
列数据类型必须兼容:类型不必完全相同,但必须是 DBMS 可以隐含转换的类型(例如,不同的数值类型或不同的日期类型)。
说明:UNION 的列名
如果结合 UNION 使用的 SELECT 语句遇到不同的列名,那么会返回什么名字呢?比如说,如果一条语句是 SELECT prod_name,而另一条语句是 SELECT productname,那么查询结果返回的是什么名字呢?
答案是它会返回第一个名字,举的这个例子就会返回 prod_name,而不管第二个不同的名字。这也意味着你可以对第一个名字使用别名,因而返回一个你想要的名字。
这种行为带来一个有意思的副作用。由于只使用第一个名字,那么想要排序也只能用这个名字。拿我们的例子来说,可以用 ORDER BY prod_name 对结果排序,如果写成 ORDER BY productname 就会出错,因为查询结果里没有叫作 productname 的列。
如果遵守了这些基本规则或限制,则可以将 UNION 用于任何数据检索操作。
包含或取消重复的行
我们看看所用的 SELECT 语句。注意到在分别执行语句时,第一条 SELECT 语句返回 3 行,第二条 SELECT 语句返回 2 行。而在用 UNION 组合两条 SELECT 语句后,只返回 4 行而不是 5 行。
UNION 从查询结果集中自动去除了重复的行;换句话说,它的行为与一条 SELECT 语句中使用多个 WHERE 子句条件一样。因为 Indiana 州有一个Fun4All 单位,所以两条 SELECT 语句都返回该行。使用 UNION 时,重复的行会被自动取消。
这是 UNION 的默认行为,如果愿意也可以改变它。事实上,如果想返回所有的匹配行,可使用 UNION ALL 而不是 UNION。
请看下面的例子:
SELECT cust_name, cust_contact, cust_email
FROM Customers
WHERE cust_state IN ('IL','IN','MI')
UNION ALL
SELECT cust_name, cust_contact, cust_email
FROM Customers
WHERE cust_name = 'Fun4All';
输出:
mysql> SELECT cust_name, cust_contact, cust_email
-> FROM Customers
-> WHERE cust_state IN ('IL','IN','MI')
-> UNION ALL
-> SELECT cust_name, cust_contact, cust_email
-> FROM Customers
-> WHERE cust_name = 'Fun4All';
+---------------+--------------------+---------------------------------+
| cust_name | cust_contact | cust_email |
+---------------+--------------------+---------------------------------+
| Village Toys | John Smith | sales@villagetoys.com |
| Fun4All | Jim Jones | jjones@fun4all.com |
| The Toy Store | Kim Howard | NULL |
| Ben's Toys | NULL | ben@fortabbwpc.wpcomstaging.com |
| Fun4All | Jim Jones | jjones@fun4all.com |
| Fun4All | Denise L. Stephens | dstephens@fun4all.com |
+---------------+--------------------+---------------------------------+
6 rows in set (0.00 sec)
mysql>
使用 UNION ALL,DBMS 不取消重复的行。因此,这里返回 5 行,其中有一行出现两次。
提示:UNION 与 WHERE
这一课一开始我们说过,UNION 几乎总是完成与多个 WHERE 条件相同的工作。UNION ALL 为 UNION 的一种形式,它完成 WHERE 子句完成不了的工作。如果确实需要每个条件的匹配行全部出现(包括重复行),就必须使用 UNION ALL,而不是 WHERE。
对组合查询结果排序
SELECT 语句的输出用 ORDER BY 子句排序。在用 UNION 组合查询时,只能使用一条 ORDER BY 子句,它必须位于最后一条 SELECT 语句之后。对于结果集,不存在用一种方式排序一部分,而又用另一种方式排序另一部分的情况,因此不允许使用多条 ORDER BY 子句。
下面的例子对前面 UNION 返回的结果进行排序:
SELECT cust_name, cust_contact, cust_email
FROM Customers
WHERE cust_state IN ('IL','IN','MI')
UNION
SELECT cust_name, cust_contact, cust_email
FROM Customers
WHERE cust_name = 'Fun4All'
ORDER BY cust_name, cust_contact;
输出:
mysql> SELECT cust_name, cust_contact, cust_email
-> FROM Customers
-> WHERE cust_state IN ('IL','IN','MI')
-> UNION
-> SELECT cust_name, cust_contact, cust_email
-> FROM Customers
-> WHERE cust_name = 'Fun4All'
-> ORDER BY cust_name, cust_contact;
+---------------+--------------------+---------------------------------+
| cust_name | cust_contact | cust_email |
+---------------+--------------------+---------------------------------+
| Ben's Toys | NULL | ben@fortabbwpc.wpcomstaging.com |
| Fun4All | Denise L. Stephens | dstephens@fun4all.com |
| Fun4All | Jim Jones | jjones@fun4all.com |
| The Toy Store | Kim Howard | NULL |
| Village Toys | John Smith | sales@villagetoys.com |
+---------------+--------------------+---------------------------------+
5 rows in set (0.01 sec)
mysql>
这条UNION在最后一条SELECT语句后使用了ORDER BY子句。虽然ORDER BY 子句似乎只是最后一条 SELECT 语句的组成部分,但实际上 DBMS 将用它来排序所有 SELECT 语句返回的所有结果。
说明:其他类型的 UNION
某些 DBMS 还支持另外两种 UNION:EXCEPT(有时称为 MINUS)可用来检索只在第一个表中存在而在第二个表中不存在的行;而 INTERSECT可用来检索两个表中都存在的行。实际上,这些 UNION 很少使用,因为相同的结果可利用联结得到。
提示:操作多个表
为了简单,本课中的例子都是使用 UNION 来组合针对同一表的多个查询。实际上,UNION 在需要组合多个表的数据时也很有用,即使是有不匹配列名的表,在这种情况下,可以将 UNION 与别名组合,检索一个结果集。
小结
这一课讲授如何用 UNION 操作符来组合 SELECT 语句。利用 UNION,可以把多条查询的结果作为一条组合查询返回,不管结果中有无重复。使用 UNION可极大地简化复杂的 WHERE 子句,简化从多个表中检索数据的工作。
小练习
1.编写 SQL 语句,将两个 SELECT 语句结合起来,以便从 OrderItems表中检索产品 ID(prod_id)和 quantity。其中,一个 SELECT 语句过滤数量为 100 的行,另一个 SELECT 语句过滤 ID 以 BNBG 开头的产品。按产品 ID 对结果进行排序。
SELECT prod_id, quantity FROM OrderItems
WHERE quantity = 100
UNION
SELECT prod_id, quantity FROM OrderItems
WHERE prod_id LIKE 'BNBG%'
ORDER BY prod_id;
输出:
mysql> SELECT prod_id, quantity FROM OrderItems
-> WHERE quantity = 100
-> UNION
-> SELECT prod_id, quantity FROM OrderItems
-> WHERE prod_id LIKE 'BNBG%'
-> ORDER BY prod_id;
+---------+----------+
| prod_id | quantity |
+---------+----------+
| BNBG01 | 100 |
| BNBG01 | 10 |
| BNBG01 | 250 |
| BNBG02 | 100 |
| BNBG02 | 10 |
| BNBG02 | 250 |
| BNBG03 | 100 |
| BNBG03 | 10 |
| BNBG03 | 250 |
| BR01 | 100 |
| BR03 | 100 |
+---------+----------+
11 rows in set (0.00 sec)
2.重写刚刚创建的 SQL 语句,仅使用单个 SELECT 语句。
SELECT prod_id, quantity FROM OrderItems
WHERE quantity = 100 OR prod_id LIKE 'BNBG%'
ORDER BY prod_id;
输出:
mysql> SELECT prod_id, quantity FROM OrderItems
-> WHERE quantity = 100 OR prod_id LIKE 'BNBG%'
-> ORDER BY prod_id;
+---------+----------+
| prod_id | quantity |
+---------+----------+
| BNBG01 | 100 |
| BNBG01 | 10 |
| BNBG01 | 250 |
| BNBG02 | 100 |
| BNBG02 | 10 |
| BNBG02 | 250 |
| BNBG03 | 100 |
| BNBG03 | 10 |
| BNBG03 | 250 |
| BR01 | 100 |
| BR03 | 100 |
+---------+----------+
11 rows in set (0.00 sec)
mysql>
3.我知道这有点荒谬,但这节课中的一个注释提到过。编写 SQL 语句,组合 Products 表中的产品名称(prod_name)和 Customers 表中的顾客名称(cust_name)并返回,然后按产品名称对结果进行排序。
SELECT prod_name
FROM Products
UNION
SELECT cust_name
FROM Customers
ORDER BY prod_name;
SELECT prod_name
FROM Products
UNION ALL
SELECT cust_name
FROM Customers
ORDER BY prod_name;
输出:
mysql>
mysql> SELECT prod_name
-> FROM Products
-> UNION
-> SELECT cust_name
-> FROM Customers
-> ORDER BY prod_name;
+---------------------+
| prod_name |
+---------------------+
| 12 inch teddy bear |
| 18 inch teddy bear |
| 8 inch teddy bear |
| Ben's Toys |
| Bird bean bag toy |
| Fish bean bag toy |
| Fun4All |
| Kids Place |
| King doll |
| Queen doll |
| Rabbit bean bag toy |
| Raggedy Ann |
| The Toy Store |
| Village Toys |
+---------------------+
14 rows in set (0.00 sec)
mysql>
mysql> SELECT prod_name
-> FROM Products
-> UNION ALL
-> SELECT cust_name
-> FROM Customers
-> ORDER BY prod_name;
+---------------------+
| prod_name |
+---------------------+
| 12 inch teddy bear |
| 18 inch teddy bear |
| 8 inch teddy bear |
| Ben's Toys |
| Bird bean bag toy |
| Fish bean bag toy |
| Fun4All |
| Fun4All |
| Kids Place |
| King doll |
| Queen doll |
| Rabbit bean bag toy |
| Raggedy Ann |
| The Toy Store |
| Village Toys |
+---------------------+
15 rows in set (0.00 sec)
mysql>
4.下面的 SQL 语句有问题吗?(尝试在不运行的情况下指出。)
SELECT cust_name, cust_contact, cust_email
FROM Customers
WHERE cust_state = 'MI'
ORDER BY cust_name;
UNION
SELECT cust_name, cust_contact, cust_email
FROM Customers
WHERE cust_state = 'IL'ORDER BY cust_name;
输出:
mysql> UNION
->
-> SELECT cust_name, cust_contact, cust_email
->
-> FROM Customers
->
-> WHERE cust_state = 'IL'ORDER BY cust_name;
ERROR 1064 (42000): You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'UNION
SELECT cust_name, cust_contact, cust_email
FROM Customers
WHERE cust' at line 1
mysql>
这;在第一个 SELECT 语句不应该存在之后,它将终止该语句。此外,如果对 SELECT 语句进行排序并与 UNION 结合使用,则只能使用一个 ORDER BY,并且它必须位于最后一个 SELECT 之后。