首先根据准备工作中的操作导入大学模式,打开数据库连接后进入到 MySQL 的交互界面,再使用命令 use db-book; 切换到 db-book 数据库。
单关系查询
SQL 查询的基本结构由三个子句构成,select,from 和 where,查询的输入是 from 子句中列出的关系,在这些关系上进行 where 和 select 子句指定的运算,然后产生一个关系作为结果,即 SQL 查询的结果是一个关系,这点很重要。 先考虑一个简单的查询,找出所有教师的名字,教师的名字可以在 instructor 关系中找到,这样我们 from instructor 来查询;教师的名字出现在 name 属性中,这样我们使用 select name 子句,综合起来就是下面的查询。
mysql> select name -> from instructor; +------------+ | name | +------------+ | Srinivasan | | Wu | | Mozart | | Einstein | | El Said | | Gold | | Katz | | Califieri | | Singh | | Crick | | Brandt | | Kim | +------------+ 12 rows in set (0.01 sec)
现在考虑另一个查询,找出所有教师所在的系名。
mysql> select dept_name -> from instructor; +------------+ | dept_name | +------------+ | Biology | | Comp. Sci. | | Comp. Sci. | | Comp. Sci. | | Elec. Eng. | | Finance | | Finance | | History | | History | | Music | | Physics | | Physics | +------------+ 12 rows in set (0.00 sec)
注意到 Comp. Sci. 等行出现了不止一次,这是因为一个系可能有多个教师。 在关系模型的形式化数学定义中,关系是一个集合,因此关系中不包含重复的元素。但在实践中,有时我们希望保留重复,更关键的事,去掉重复是消耗较大的,因此 SQL 默认在关系以及 SQL 表达式结果中允许出现重复。 如果我们想要去掉重复,可以在 select 后加入关键字 distinct,也就是像下面这样。
mysql> select distinct dept_name -> from instructor; +------------+ | dept_name | +------------+ | Biology | | Comp. Sci. | | Elec. Eng. | | Finance | | History | | Music | | Physics | +------------+ 7 rows in set (0.01 sec)
完整地说,SQL 支持使用关键字 all 来显式指明不去掉重复,但因为标准默认的行为即保留重复元组,因此不使用 all 才是更符合习惯的写法。 select 子句还可带含有四则运算运算符的表达式,运算对象可以是常数或元组的属性,这一点对应关系代数运算中的广义投影,看下面的查询。
mysql> select ID, name, dept_name, salary * 1.1 -> from instructor; +-------+------------+------------+--------------+ | ID | name | dept_name | salary * 1.1 | +-------+------------+------------+--------------+ | 10101 | Srinivasan | Comp. Sci. | 71500.000 | | 12121 | Wu | Finance | 99000.000 | | 15151 | Mozart | Music | 44000.000 | | 22222 | Einstein | Physics | 104500.000 | | 32343 | El Said | History | 66000.000 | | 33456 | Gold | Physics | 95700.000 | | 45565 | Katz | Comp. Sci. | 82500.000 | | 58583 | Califieri | History | 68200.000 | | 76543 | Singh | Finance | 88000.000 | | 76766 | Crick | Biology | 79200.000 | | 83821 | Brandt | Comp. Sci. | 101200.000 | | 98345 | Kim | Elec. Eng. | 88000.000 | +-------+------------+------------+--------------+ 12 rows in set (0.00 sec)
这个查询,如上所示,返回一个与 instructor 一样的关系,除了属性 salary 的值是原来的 1.1 倍,查询的语义是为每位教师增长 10% 的工资的结果,注意这并不修改 instructor 关系,而是返回了一个新的关系。 where 子句允许我们只选出那些在 from 子句的结果关系中满足特定谓词的元组。 考虑查询,找出所有在 Computer Science 系并且工资超过 70000 美元的教师的姓名。我们可以使用 where 子句写出下面的查询。
mysql> select name -> from instructor -> where dept_name = 'Comp. Sci.' and salary > 70000; +--------+ | name | +--------+ | Katz | | Brandt | +--------+ 2 rows in set (0.01 sec)
SQL 允许在 where 子句中使用逻辑连词 and,or 和 not,逻辑连词的运算对象可以是包含比较运算符的表达式。注意相等用 = 表示,不相等用 <> 表示。
多关系查询
上面的查询都是基于单个关系的,但是通常我们的查询需要从多个关系中获取信息。 考虑查询,找出所有教师的姓名,以及他们所在的系的名称和系所在的建筑物的名称。考虑 instructor 关系的模式,我们可以从 dept_name 属性得到系名,但是系所在的建筑物的名称记录在 department 关系的 building 属性中,为了回答查询,instructor 关系中的每个元组必须与 department 关系中的元组匹配,后者在 dept_name 上的取值等于 instructor 元组在 dept_name 上的取值。有了这样的思路,我们可以尝试写对应的 SQL 查询。
mysql> select name, instructor.dept_name, building -> from instructor, department -> where instructor.dept_name = department.dept_name; +------------+------------+----------+ | name | dept_name | building | +------------+------------+----------+ | Crick | Biology | Watson | | Srinivasan | Comp. Sci. | Taylor | | Katz | Comp. Sci. | Taylor | | Brandt | Comp. Sci. | Taylor | | Kim | Elec. Eng. | Taylor | | Wu | Finance | Painter | | Singh | Finance | Painter | | El Said | History | Painter | | Califieri | History | Painter | | Mozart | Music | Packard | | Einstein | Physics | Watson | | Gold | Physics | Watson | +------------+------------+----------+ 12 rows in set (0.00 sec)
注意 dept_name 属性既出现在 instructor 关系中,也出现在 department 关系中,关系名作为前缀可以说明我们指的是哪一个属性,与之相反,name 属性和 building 属性只出现在一个关系中,因而不需要把关系名作为前缀。这种命名惯例的使用,要求出现在 from 子句中的关系具有可区分的名字,在某些情况下这样的要求达不到,例如当需要组合来自同一个关系的两个不同元组的信息的时候,对于这种情况,在后面我们会提到可以用更名(rename)运算来处理。 再考虑一个查询,找出 Computer Science 系的教师名字和教授的课程标识
mysql> select name, course_id -> from instructor, teaches -> where instructor.ID = teaches.ID and dept_name = 'Comp. Sci.'; +------------+-----------+ | name | course_id | +------------+-----------+ | Srinivasan | CS-101 | | Srinivasan | CS-315 | | Srinivasan | CS-347 | | Katz | CS-101 | | Katz | CS-319 | | Brandt | CS-190 | | Brandt | CS-190 | | Brandt | CS-319 | +------------+-----------+ 8 rows in set (0.00 sec)
这里 dept_name 只出现在 instructor 关系中,因此不必要写 instructor.dept_name。
通常说来,一个 SQL 查询的含义可以这么理解: 1.按照 from 子句中列出的关系产生笛卡尔积 2.在步骤 1 的结果上应用 where 子句指定的谓词筛选 3.在步骤 2 的结果上输出 select 子句指定的属性或表达式的结果
注意这是逻辑上的执行方式,实际执行会有较多的优化方式,例如尽可能地不产生一个庞大的笛卡尔积,而是只产生满足 where 子句的笛卡尔积元素。