专门的关系运算(Specific relation operations)包括选择、投影、连接、除等。
为了叙述上的方便,我们先引入几个记号。
⒈ 设关系模式为R(A1, A2, …, An)。它的一个关系设为R。t∈R表示t是R的一个元组。t[Ai]则表示元组t中相应于属性Ai的一个分量 。
⒉ 若A={Ai1, Ai2, …, Aik},其中Ai1, Ai2, …, Aik是A1, A2, …, An中的一部分,则A称为属性列或域列。フA则表示{A1, A2, …, An}中去掉{Ai1, Ai2, …, Aik}后剩余的属性组。t[A]=(t[Ai1], t[Ai2], …, t[Aik])表示元组t在属性列A上诸分量的集合。
⒊ R为n目关系,S为m目关系。设tr∈R(r为下标),ts∈S(s为下标),则trts(整个式子上方加一个半弧,r和s为下标) 称为元组的连接(Concatenation)。它是一个(n+m)列的元组,前n个分量为R中的一个n元组,后m个分量为S中的一个m元组。
⒋ 给定一个关系R(X,Z),X和Z为属性组。我们定义,当t[X]=x时,x在R中的象集(Images Set)为:
Zx={t[Z]|t∈R, t[X]=x}
它表示R中属性组X上值为x的诸元组在Z上分量的集合。
⒈ 选择(Selection)
选择又称为限制(Restriction)。它是在关系R中选择满足给定条件的诸元组,记作:
σF(R) = {t|t∈R ∧ F(t)='真'}
其中F表示选择条件,它是一个逻辑表达式,取逻辑值‘真’或‘假’。
逻辑表达式F的基本形式为:
X1 θ Y1 [ φ X2 θ Y2 ]
θ表示比较运算符,它可以是>、≥、<、≤、=或≠。X1、Y1等是属性名或常量或简单函数。属性名也可以用它的序号来代替。φ表示逻辑运算符,它可以是フ、∧或∨。[ ]表示任选项,即[ ]中的部分可以要也可以不要,...表示上述格式可以重复下去。
因此选择运算实际上是从关系R中选取使逻辑表达式F为真的元组。这是从行的角度进行的运算。
⒉ 投影(Projection)
关系R上的投影是从R中选择出若干属性列组成新的关系。记作:
ΠA(R) = { t[A] | t∈R }
其中A为R中的属性列。
⒊ 连接(Join)
连接包括θ连接,自然连接,外连接,半连接。它是从两个关系的笛卡尔积中选取属性间满足一定条件的元组。
连接运算从R和S的笛卡尔积R×S中选取(R关系)在A属性组上的值与(S关系)在B属性组上值满足比较关系θ的元组。
连接运算中有两种最为重要也最为常用的连接,一种是等值连接(equi-join),另一种是自然连接(Natural join)。
θ为“=”的连接运算称为等值连接。它是从关系R与S的笛卡尔积中选取A、B属性值相等的那些元组。
自然连接(Natural join)是一种特殊的等值连接,它要求两个关系中进行比较的分量必须是相同的属性组,并且要在结果中把重复的属性去掉。
一般的连接操作是从行的角度进行运算。但自然连接还需要取消了重复列,所以是同时从行和列的角度进行运算。
4. 除(Division)
给定关系R(X,Y)和S(Y,Z),其中X, Y, Z为属性组。R中的Y与S中的Y&127可以有不同的属性名,但必须出自相同的域集。R与S的除运算得到一个新的关系P(X)。该P中只包含R中投影下来的的X属性组,且该X属性组应满足:R(Y)=S(Y)。
在关系代数运算中,除了交操作之外,都不会消去任何元素。交操作可以消去那些不在两个关系中都出现过的元素。例如,如果有两个关系 R 和 S,则 R ∩ S 中包含的元素必须同时出现在 R 和 S 中。如果某个元素只出现在其中一个关系中,那么在交操作的结果中,该元素就会被消去。
一、关系代数的9种操作:关系代数中包括了:并、交、差、乘、选择、投影、联接、除、自然联接等操作。五个基本操作:并(∪)、差(-)、笛卡尔积(×)、投影(σ)、选择(π)四个组合操作:交(∩)、联接(等值联接)、自然联接(RS)、除法(÷)注2:等值连接表示先做笛卡尔积(×)之后,对相应列进行选择或等值关联后的结果(仅筛选行、不筛选列)注2:自然连接表示两个关系中若有相同名称的属性,则自动作为关联条件,且仅列出一列二、关系代数表达式:由关系代数运算经有限次复合而成的式子称为关系代数表达式。这种表达式的运算结果仍然是一个关系。可以用关系代数表达式表示对数据库的查询和更新操作。三、举例说明:设教学数据库中有3个关系:学生关系S(SNO,SNAME,AGE,SEX)学习关系SC(SNO,CNO,GRADE)课程关系C(CNO,CNAME,TEACHER)(1)检索学习课程号为C2的学生学号与成绩------------------------------------SELECTSNO,GRADEFROMSCWHERECNO='C2'------------------------------------πSNO,GRADE(σCNO='C2'(SC))************************************(2)检索学习课程号为C2的学生学号与姓名------------------------------------SELECTSC.SNO,S.SNAMEFROMSC,SWHERESC.SNO=S.SNOANDSC.CNO='C2'------------------------------------πSNO,SNAME(σCNO='C2'(SSC))此查询涉及S和SC,先进行自然连接,然后再执行选择投影操作。----πSNO,SNAME(S)(πSNO(σCNO='C2'(SC)))自然连接的右分量为"学了C2课的学生学号的集合"。此表达式比前一个表达式优化,执行起来要省时间、省空间。************************************(3)检索选修课程名为MATHS的学生学号与姓名------------------------------------SELECTSC.SNO,S.SNAMEFROMSC,S,CWHERESC.SNO=S.SNOANDSC.CNO=C.CNOANDC.CNAME='MATHS'------------------------------------πSNO,SANME(σCNAME='MATHS'(SSCC))************************************(4)检索选修课程号为C2或C4的学生学号------------------------------------SELECTSNOFROMSCWHERECNO='C2'ORCNO='C4'------------------------------------πSNO(σCNO='C2'∨CNO='C4'(SC))************************************(5)检索至少选修课程号为C2或C4的学生学号------------------------------------SELECTSA.SNOFROMSCASSA,SCASSBWHERESA.SNO=SB.SNOANDSA.CNO='C2'ANDSB.CNO='C4'------------------------------------π1(σ1=4∧2='C2'∧5='C4'(SC×SC))************************************(6)检索不学C2课的学生姓名与年龄------------------------------------SELECTSNAME,AGEFROMSMINUSSELECTS.SNAME,S.AGEFROMSC,SWHERESC.SNO=S.SNOANDSC.CNO='C2'(Oracle)------------------------------------πSNAME,AGE(S)-πSNAME,AGE(σCNO='C2'(SSC))************************************(7)检索学习全部课程的学生姓名------------------------------------这个定义用SQL表示比较麻烦,略过------------------------------------πSNO,CNO(SC)÷πCNO(C)先用除法取出选取所有课程的SNO集(除法可以理解为一个Filter)πSNAME(S(πSNO,CNO(SC)÷πCNO(C)))再关联S表取出SNAME************************************(8)检索所学课程包含S3所学课程的学生学号------------------------------------这个定义用SQL表示比较麻烦,略过------------------------------------πSNO,CNO(SC)÷πCNO(σSNO='S3'(SC))同样运用了除法的特性************************************(9)将新课程元组('C10','PHYSICS','YU')插入到关系C中------------------------------------INSERTINTOCVALUES('C10','PHYSICS','YU')------------------------------------(C∪('C10','PHYSICS','YU'))记住该符号的用法************************************(10)将学号S4选修课程号为C4的成绩改为85分------------------------------------UPDATESCSETGRADE=85WHERESNO='S4'ANDCNO='C4'------------------------------------(SC-('S4','C4',?)∪('S4','C4',85))先用'-'实现DELETE功能,再用'∪'实现INSERT功能注意使用?来表示检索时忽略该字段值************************************四、关系代数表达式的优化:目的:为了系统在执行时既省时间又能提高效率。基本策略:先做选择,运用投影去除多余属性等等。优化算法:语法树(尽量提前做选择操作;在每个操作后,应做个投影操作,去掉不用的属性值)例如:πSNO,SNAME(σGRADE>60(SSC))进行优化后转换为:πSNO,SNAME(πSNO,SNAME(S)πSNO(σGRADE>60(SC)))--即提前做选择操作;在每个操作后,应做个投影操作,去掉不用的属性值又如:S(S#,SNAME,AGE,SEX)SC(S#,C#,GRADE)C(C#,CNAME,TEACHER)πCNAME,TEACHER(σSEX='女'(SSCC))进行优化后转换为:πCNAME,TEACHER(CπC#(πS#,C#(SC)πS#(σSEX='女'(S))))