《关系数据理论》PPT课件.ppt
《《关系数据理论》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《关系数据理论》PPT课件.ppt(28页珍藏版)》请在装配图网上搜索。
数据库原理及应用PrincipleandApplicationofDatabase第五章关系数据理论 学习目标 理解关系模式可能的四种异常掌握函数依赖的基本概念掌握1NF 2NF 3NF BCNF和4NF的概念和特点掌握规范化的基本步骤 5 1问题的提出 关系数据库逻辑设计针对具体问题 如何构造一个适合于它的数据模式 数据库逻辑设计的工具是关系数据库的规范化理论 概念回顾关系 描述实体 属性 实体间的联系 从形式上看 它是一张二维表 是所涉及属性的笛卡尔积的一个子集 关系模式 用来定义关系 关系数据库 基于关系模型的数据库 利用关系来描述现实世界 从形式上看 它由一组关系组成 关系模式的形式化定义 关系模式是一个五元组 R U D DOM F 其中 R为关系名 U为组成该关系的属性名集合 D为属性组U中属性所来自的域 DOM为属性向域的映象集合 F为属性间数据的依赖关系集合 数据依赖 是通过关系中属性间值的相等与否体现出来的数据间的相互关系 是现实世界属性间相互联系的抽象 是数据内在的性质 是语义的体现 最重要的数据依赖是函数依赖FD FunctionalDependency 和多值依赖MVD MultivaluedDependency 关系模式的简化 关系模式R U D DOM F 可以简化为一个三元组R U F 当且仅当U上的一个关系r满足F时 r称为关系模式R U F 的一个关系 如描述学生的数据库 学生的学号 Sno 系别 Sdept 系主任姓名 Mname 课程名 Cname 成绩 Grade 则关系模式为Student 属性组U Sno Sdept Mname Cname Grade 假设学生数据库的语义有 一个系有若干学生 一个学生只属于一个系 一个系只有一名系主任 一个学生可以选修多门课程 每门课程可以有若干学生选修 每个学生所选修的每门课程都有一个成绩 则有如下函数据依赖集 F Sno Sdept Sdept Mname Sno Cname Grade 关系模式Student中存在的问题数据冗余太大 浪费大量的存储空间 如每个系主任姓名与该系每个学生的每门选修课程的成绩出现次数一样 插入异常 InsertionAnomalies 该插的数据插不了 如一个系刚成立 尚无学生 就无法把这个系及其系主任的信息存入数据库 删除异常 DeletionAnomalies 不该删除的数据被删了 如某个系的学生全部毕业了 在删除该系学生信息的同时 把这个系及其系主任的信息也删了 更新异常 UpdateAnomalies 数据冗余 更新数据时维护数据完整性代价大 如某系更换系主任后 必须修改与该系学生有关的每一个元组 结论 Student关系模式不是一个好的模式 好 的模式不会发生插入异常 删除异常 更新异常 数据冗余应尽可能少 引起上述异常的原因是存在于模式中的某些不合适数据依赖 解决方法是通过分解关系模式来消除其中不合适的数据依赖 如把上述模式分成三个关系模式 S Sno Sdept Sno SDEPT SG Sno Cname Grade Sno Cname Grade DEPT Sdept Mname SDEPT Mname 这三个模式都不会发生插入异常 删除异常等 数据的冗余也得到了很好的控制 规范化理论 通过分解关系模式来消除其中不合适的数据依赖 以解决插入异常 删除异常 更新异常和数据冗余问题 函数依赖函数依赖的定义 设R U 是一个属性集U上的关系模式 X和Y是U的子集 若对于R U 的任意一个可能的关系r r中不可能存在两个元组在X上的属性值相等 而在Y上的属性值不等 则称 X函数确定Y 或 Y函数依赖于X 记作X Y X称为这个函数依赖的决定属性集 若X Y 并且Y X 则记为X Y 若Y不函数依赖于X 则记为X Y 说明 函数依赖不是指关系模式R的某个或某些关系实例满足的约束条件 而是指R的所有关系实例均要满足的约束条件 函数依赖是语义范畴的概念 只能根据数据的语义来确定函数依赖 如 姓名 年龄 这个函数依赖只有在不允许有同名人的条件下成立 用户可以对现实世界作强制规定 如规定不允许同名人出现 函数依赖 姓名 年龄 成立 5 2规范化 例 Student Sno Sname Ssex Sage Sdept 假设不允许重名 则有 Sno Ssex Sno Sage Sno Sdept Sno Sname Sname Ssex Sname Sage Sname Sdept 但Ssex Sage 平凡函数依赖与非平凡函数依赖 在关系模式R U 中 对于U的子集X和Y 如果X Y 但Y X 则称X Y是非平凡的函数依赖 若X Y 但Y X 则称X Y是平凡的函数依赖 例 在关系SC Sno Cno Grade 中 Sno Cno Grade是非平凡函数依赖 Sno Cno Sno Sno Cno Cno是平凡函数依赖 对于任一关系模式 平凡函数依赖都是必然成立的 它不反映新的语义 因此若不特别声明 总是讨论非平凡函数依赖 完全函数依赖与部分函数依赖 在关系模式R U 中 若X Y 且对于X的任何一个真子集X 都有X Y 则称Y完全函数依赖于X 记作X Y 若X Y 但Y不完全函数依赖于X 则称Y部分函数依赖于X 记作XPY 例 关系SC Sno Cno Grade 中 由于Sno Grade Cno Grade 因此 Sno Cno Grade 传递函数依赖 在关系模式R U 中 如果X Y Y Z 且Y X Y X 则称Z传递函数依赖于X 记作XtZ 若Y X 即X Y 则Z直接依赖于X 例 关系Std Sno Sdept Mname 中 有Sno Sdept Sdept Mname 则Mname传递函数依赖于Sno 码 Key 又称关键字或键 侯选码 CandidateKey 设K为关系模式R中的属性或属性组合 若K U 则K称为R的一个侯选码 若K为R的整个属性组 则这样候选码称为全码 如关系Student Sno Sname Sage Ssex Sdept 中若每个学生不允许重名 则Sno Sname是两个候选码 关系SC Sno Cno Grade 中 Sno Cno 是一个候选码 主码 Primarykey 若关系模式R有多个候选码 则选定其中的一个就称为主码 主属性与非主属性 包含在任一候选码中的属性称为主属性 不包含在任何候选码中的属性称为非主属性 外码 Foreignkey 关系模式R中属性或属性组X并非R的码 但X是另一个关系模式的码 则称X是R的外码 如关系SC Sno Cno Grade 中Sno不是码 但Sno是关系Student的码 则Sno是关系SC的外码 主码和外码一起提供了表示关系间联系的手段 范式 是符合某一种级别的关系模式的集合 关系数据库中的关系必须满足一定的要求 范式 范式分第一范式 1NF 第二范式 2NF 第三范式 3NF BC范式 BCNF 第四范式 4NF 各种范式之间存在联系 1NF 2NF 3NF BCNF 4NF某一关系模式R为第n范式 可简记为R nNF 1NF定义 如果一个关系模式R的所有属性都是不可分的基本数据项 则R 1NF 1NF是对关系模式的最起码的要求 不满足1NF的数据库模式不能称为关系数据库 例 关系模式SLC Sno Sdept Sloc Cno Grade 其中 Sloc为学生住处 假设每个系的学生住在同一个地方 函数依赖有Sno Sdept Sdept Sloc Sno Cno PSdept Sno Cno PSloc SLC的码为 Sno Cno SLC 1NF 1NF模式存在的问题 SLC不是一个好的关系模式 数据冗余度大 若一个学生选修了10门课程 则他的Sdept和Sloc值就要重复存储10次 插入异常 假设Sno 95102 Sdept IS Sloc N的学生还未选课 因课程号是主属性 因此该学生信息无法插入SLC 删除异常 若某个学生本来只选修了3号课程这一门课 现在因某种原因 他连3号课程也不选修了 因课程号是主属性 此操作将导致该学生信息的整个元组都要删除 修改异常 若某学生转系 在修改该元组的Sdept值的同时 还可能需要修改住处 Sloc 如果这个学生选修了K门课 则必须无遗漏地修改K个元组中全部Sdept Sloc 引起原因 Sdept Sloc部分函数依赖于码 Sno Cno 解决方法 采用投影分解法 将SLC分解为两个模式SC Sno Cno Grade SL Sno Sdept Sloc 消除部分函数依赖 2NF定义 若关系模式R 1NF 并且每一个非主属性都完全函数依赖于R的码 则R 2NF 若R 2NF 则R 1NF 例 SLC Sno Sdept Sloc Cno Grade 1NFSLC Sno Sdept Sloc Cno Grade 2NFSC Sno Cno Grade 2NFSL Sno Sdept Sloc 2NF采用投影分解法将一个1NF的关系分解为多个2NF关系 可以在一定程度上减轻原1NF关系中存在的数据冗余度大 插入异常 删除异常 修改异常等问题 但不能完全消除 例 关系SL Sno Sdept Sloc 中函数依赖有Sno Sdept Sdept Sloc Sno Sloc 即SL中存在非主属性Sloc对码Sno的传递函数依赖 2NF模式存在的问题 SL不是一个好的关系模式 数据冗余度大 若计算机系有10个学生 则计算机系学生的Sloc值就要重复存储10次 插入异常 如某系刚成立 暂无住校学生 该系的信息就无法插入 删除异常 如某系学生全部毕业时 删除了该系学生信息的同时该系的信息也被删除了 修改异常 如学校调整某系学生住处时 必须修改该系所有学生的Sloc值 引起原因 Sloc传递函数依赖于码Sno 解决方法 采用投影分解法 将SL分解为两个关系模式SD Sno Sdept DL Sdept Sloc 以消除传递函数依赖 3NF定义 关系模式R中若不存在这样的码X 属性组Y及非主属性Z Z Y 使得X Y Y X Y Z成立 则称R 3NF 若R 3NF 则R 2NF 例 SL Sno Sdept Sloc 2NFSL Sno Sdept Sloc 3NFSD Sno Sdept 3NFDL Sdept Sloc 3NF若R 3NF 则R的每一个非主属性既不部分函数依赖于候选码也不传递函数依赖于候选码 采用投影分解法将一个2NF的关系分解为多个3NF关系 可以在一定程度上减轻原2NF关系中存在的数据冗余度大 插入异常 删除异常 修改异常等问题 但不能完全消除 3NF模式存在的问题设在关系模式STJ S T J 中 S T J分别表示学生 教师和课程 假设每一教师只教一门课 每门课由若干教师教 某学生选定某门课就确定了一个固定教师 则有函数依赖 S J T S T J T J 显然 S J 和 S T 都为候选码 该模式没有非主属性 STJ 3NF 但它存在问题 数据冗余度大 虽一个教师只教一门课 但每个选修该教师该门课的学生元组都要记录这一信息 插入异常 如学生刚入校尚未选课 因主属性不能为空 该生信息就无法存入数据库 同样如某教师开设了新课 但尚未有学生选修 则该信息也无法存入数据库 删除异常 如选修某课的学生全部毕业时删除他们信息的同时相应教师开设该课的信息也被删除 修改异常 如某教师开设的某门课改名后 所有选修该教师该门课的学生都应进行修改 引起原因 存在 S T p主属性J 解决方法 采用投影分解法 将STJ分解为两个关系模式SJ S J 和TJ T J BCNF定义 设关系模式R 1NF 如果对于R的每个函数依赖X Y 若Y不属于X 则X必含有候选码 那么R BCNF 若R BCNF 则R 3NF 例 关系模式SJP S J P 中 S J P分别表示学生 课程和名次 每个学生选修每门课程的成绩都有一定的名次 每门课程中每一名次只有一个学生 即没有并列名次 则有函数依赖 S J P J P S 所以 S J 与 J P 都可以作为候选码 SJP BCNF 性质若R 3NF 且R只有一个候选码 则R必属于BCNF 所有非主属性对每一个码都是完全函数依赖 所有的主属性对每一个不包含它的码都是完全函数依赖 没有任何属性完全函数依赖于非码的任何一组属性 从函数依赖的范畴考虑 BCNF已完成了模式的彻底分解 消除了插入 删除和更新异常 数据冗余度大大降低 但从数据依赖的角度 BCNF的关系模式仍存在一定的问题 多值依赖引例 设学校中某门课由多个教师讲课 他们使用相同的参考书 可由关系模式Teaching C T B 表示课程C 教师T和参考书B之间的关系 对应的一张二维表如右 Teach具有唯一候选码 C T B 即全码 所以Teaching BCNF 但Teaching模式中存在如下问题 数据冗余度大 有多少名任课教师 参考书就要存储多少次 插入操作复杂 若某一课程增加一名教师 该课程有N本参考书 就必须插入N个元组 如物理课增加一名教师刘强 需插入两个元组 物理 刘强 普通物理学 物理 刘强 光学原理 删除操作复杂 某一门课要去掉一本参考书 该课程有多少名教师 就必须删除多少个元组 修改操作复杂 某一门课要修改一本参考书 该课程有多少名教师 就必须修改多少个元组 引起原因 关系模式Teaching中存在多值依赖 多值依赖的定义 设关系模式R U 中 X Y和Z是U的子集 并且Z U X Y 多值依赖X Y成立当且仅当对R的任一关系r r在 X Z 上的每个值对应一组Y的值 这组值仅仅决定于X值而与Z值无关 如Teaching C T B 中对于C的每一个值 T有一组值与之对应 而不论B取何值 则有C T 多值依赖的形式化定义 在R U U X Y Z 的任一关系r中 若存在元组t s使得t X s X 则必然存在元组w v r w v可以与s t相同 使得w X v X t X 而w Y t Y w Z s Z v Y s Y v Z t Z 即交换s t元组的Y值所得的两个新元组必在r中 则Y多值依赖于X 记为X Y txy1z2sxy2z1wxy1z1vxy2z2若X Y 而Z 则称X Y为平凡的多值依赖 多值依赖的性质多值依赖具有对称性若X Y 则X Z 其中Z U X Y 多值依赖具有传递性若X Y Y Z 则X Z Y 函数依赖是多值依赖的特殊情况 若X Y 则X Y 若X Y X Z 则X YUZ 若X Y X Z 则X Y Z 若X Y X Z 则X Y Z X Z Y 多值依赖与函数依赖的区别多值依赖的有效性与属性集的范围有关若X Y在U上成立 则在W X Y W U 上一定成立 反之则不然 即X Y在W W U 上成立 在U上并不一定成立 即多值依赖的定义中不仅涉及属性组X和Y 而且涉及U中其余属性Z 一般地 在R U 上若有X Y在W W U 上成立 则称X Y为R U 的嵌入型多值依赖 对于函数依赖 只要在R U 的任何一个关系r中 元组在X和Y上的值只要满足函数依赖的定义 则函数依赖X Y在任何属性集W X Y W U 上成立 若函数依赖X Y在R U 上成立 则对于任何Y Y均有X Y 成立 多值依赖X Y若在R U 上成立 不能断言对于任何Y Y有X Y 成立 4NF定义 关系模式R 1NF 如果对于R的每个非平凡多值依赖X Y Y X X都含有候选码 则R 4NF 若R 4NF 则R BCNF 例 Teaching C T B 4NF 因为存在非平凡的多值依赖C T 且C不是候选码 用投影分解法把Teaching分解为CT C T CB C B 两个关系模式 它们均是4NF 性质 4NF就是限制关系模式的属性之间不允许有非平凡且非函数依赖的多值依赖 所允许的是非平凡的多值依赖实际上就是函数依赖 规范化小结关系数据库的规范化理论是数据库逻辑设计的工具 一个关系只要其分量都是不可分的数据项 它就是规范化的关系 但这只是最基本的规范化 规范化程度过低的关系不一定能够很好地描述现实世界 可能会存在数据冗余大 插入异常 删除异常 修改异常等问题 一个低一级范式的关系模式 通过模式分解可转换为若干个高一级范式的关系模式集合 这种过程就叫关系模式的规范化 规范化步骤1NF经消除非主属性对码的部分函数依赖后为2NF 2NF经消除非主属性对码的传递函数依赖后为3NF 3NF经消除主属性对码的部分和传递函数依赖后为BCNF BCNF经消除非平凡且非函数依赖的多值依赖后为4NF 规范化的基本思想消除不合适的数据依赖的各关系模式达到某种程度的分离 采用 一事一地 的模式设计原则 让一个关系描述一个概念 一个实体或者实体间的一种联系 若多于一个概念就把它分离出去 所谓规范化实质上是概念的单一化 不能说规范化程度越高的关系模式就越好 在设计数据库模式结构时 必须对现实世界的实际情况和用户应用需求作进一步分析 确定一个合适的 能够反映现实世界的模式 规范化步骤可以在其中任何一步终止 小结 关系模式可能的四种异常函数依赖的基本概念1NF 2NF 3NF BCNF和4NF的概念和特点规范化的基本步骤 作业 P196第1题 预习5 3 5 4 下课了 休息 研究- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 关系数据理论 关系 数据 理论 PPT 课件
装配图网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
关于本文