关系数据库规范化理论
为了使数据库设计的方法走向完备,人们研究了规范化理论,指导我们设计规范的数据库模式。按属性间依赖情况来区分,关系规范化的程度为第一范式、第二范式、第三范式、BCNF范式和第四范式等。1. 函数依赖
数据依赖是现实世界中属性间联系和约束的抽象,是数据的内在性质。
函数依赖(functional dependency,FD )是一种最重要、最基本的数据依赖。其具体定义如下:
设有关系模式R(U),X和Y是属性集U的子集,FD是行为X→Y的一个命题,只要r是R的关系,对r中任意两个元组都有“X值相等蕴涵Y值相等”,那么函数依赖X→Y在关系模式R(U)中成立。
FD与侯选键之间的关系:若存在X->U,并且不存在X的任意真子集X1,使得X1->U成立,那么就称X为关系的一个侯选键。
函数依赖还有几条推理规则:
自反性;增广性;传递性;并规则;分解规则;伪传递规则;
2. 模式分解
模式分解目的是消除冗余和操作异常问题。
模式分解的三个定义:
-分解具有“无损连接性”
-分解要“保持函数依赖”
-分解既要“保持函数依赖”,又要具有“无损连接性”。
关系模式分解的两个特性实际涉及到两个数据库模式的等价性问题。包括数据等价和依赖等价两个方面:
数据等价:两个数据库实例应表示同样的信息内容,用“无损联接”衡量。
依赖等价:两个数据库模式应有相互逻辑关系的函数依赖集,此时数据的语义是不会出现差错的。
例:关系模式 S-L-C(SNO,SDEPT,SLOC,CNO,G)中,SLOC为学生的住处,并且每个系的学生住在同一个地方。
这里码为(SNO,CNO)。函数依赖有:
f
(SNO,CNO) → G
SNO→SDEPT,
p
(SNO,CNO) → SDEPT SNO→SLOC,
p
(SNO,CNO) → SLOC
SDEPT→SLOC
用投影分解把关系模式S-L-C分解为3NF范式,且保持函数依赖。
解法:
⑴ 对R〈U,F〉中的函数依赖集F进行“极小化处理”。
F= { SNO,CNO→G,SNO→SDEPT,SDEPT→SLOC }。
⑵ R中没有不在F中出现的属性。
⑶ 不存在X→AÎF,且XA=U,接着做第⑷步。
⑷ 对F按具有相同左部的原则分组。
r={SC{ SNO,CNO,G },SNO,CNO→G},S-D〈{ SNO,SDEPT }, SNO→SDEPT〉,
D-L〈{ SDEPT,SLOC }, SDEPT→SLOC〉}
3. 范式
范式(normal form,NF)是衡量关系模式的优劣的标准。范式有很多种,与数据依赖有着直接的联系。
第一范式1NF:
如果关系模式R中,每个分量是不可分的数据项,就称R属于第一范式。
第二范式2NF:
若关系模式R属于1NF,且每个非主属性完全函数依赖于候选关键字,则称R属于第二范式。
第三范式3NF:
若关系模式R属于1NF,且每个非主属性都不传递依赖于R的候选关键字,则称R属于第三范式。这里的主属性是指键的属性,而不是任何键的属性就是非主属性
BC范式BCNF:
若关系模式R属于1NF,且每个属性都不传递依赖于R的候选关键字,则称R属于BC范式。
由上可知,4种范式之间的关系:BCNF<3NF<2NF<1NF 这几天看书,强调知行合一,呵呵。
页:
[1]