ehxz 发表于 2007-10-16 08:57:49

关系数据库规范化理论

为了使数据库设计的方法走向完备,人们研究了规范化理论,指导我们设计规范的数据库模式。按属性间依赖情况来区分,关系规范化的程度为第一范式、第二范式、第三范式、BCNF范式和第四范式等。

1. 函数依赖
    数据依赖是现实世界中属性间联系和约束的抽象,是数据的内在性质。

    函数依赖(functional dependency,FD )是一种最重要、最基本的数据依赖。其具体定义如下:

    设有关系模式R(U),X和Y是属性集U的子集,FD是行为X→Y的一个命题,只要r是R的关系,对r中任意两个元组都有“X值相等蕴涵Y值相等”,那么函数依赖X→Y在关系模式R(U)中成立。

    FD与侯选键之间的关系:若存在X->U,并且不存在X的任意真子集X1,使得X1->U成立,那么就称X为关系的一个侯选键。

    函数依赖还有几条推理规则:

    自反性;增广性;传递性;并规则;分解规则;伪传递规则;

2. 模式分解
    模式分解目的是消除冗余和操作异常问题。

    模式分解的三个定义:

-分解具有“无损连接性”

-分解要“保持函数依赖”

-分解既要“保持函数依赖”,又要具有“无损连接性”。

    关系模式分解的两个特性实际涉及到两个数据库模式的等价性问题。包括数据等价和依赖等价两个方面:

    数据等价:两个数据库实例应表示同样的信息内容,用“无损联接”衡量。

    依赖等价:两个数据库模式应有相互逻辑关系的函数依赖集,此时数据的语义是不会出现差错的。

    例:关系模式 S-L-C(SNO,SDEPT,SLOC,CNO,G)中,SLOC为学生的住处,并且每个系的学生住在同一个地方。

    这里码为(SNO,CNO)。函数依赖有:

            f

    (SNO,CNO) → G

    SNO→SDEPT,

               p

    (SNO,CNO) → SDEPT SNO→SLOC,

               p

    (SNO,CNO) → SLOC

    SDEPT→SLOC

    用投影分解把关系模式S-L-C分解为3NF范式,且保持函数依赖。

    解法:

    ⑴ 对R〈U,F〉中的函数依赖集F进行“极小化处理”。

    F= { SNO,CNO→G,SNO→SDEPT,SDEPT→SLOC }。

    ⑵ R中没有不在F中出现的属性。

    ⑶ 不存在X→AÎF,且XA=U,接着做第⑷步。

    ⑷ 对F按具有相同左部的原则分组。

    r={SC{ SNO,CNO,G },SNO,CNO→G},S-D〈{ SNO,SDEPT }, SNO→SDEPT〉,

    D-L〈{ SDEPT,SLOC }, SDEPT→SLOC〉}

3. 范式
    范式(normal form,NF)是衡量关系模式的优劣的标准。范式有很多种,与数据依赖有着直接的联系。

    第一范式1NF:

    如果关系模式R中,每个分量是不可分的数据项,就称R属于第一范式。

    第二范式2NF:

    若关系模式R属于1NF,且每个非主属性完全函数依赖于候选关键字,则称R属于第二范式。

    第三范式3NF:

    若关系模式R属于1NF,且每个非主属性都不传递依赖于R的候选关键字,则称R属于第三范式。这里的主属性是指键的属性,而不是任何键的属性就是非主属性

    BC范式BCNF:

    若关系模式R属于1NF,且每个属性都不传递依赖于R的候选关键字,则称R属于BC范式。

    由上可知,4种范式之间的关系:BCNF<3NF<2NF<1NF

ehxz 发表于 2008-1-22 16:33:55

这几天看书,强调知行合一,呵呵。
页: [1]
查看完整版本: 关系数据库规范化理论