《数据库》PPT课件.ppt_第1页
《数据库》PPT课件.ppt_第2页
《数据库》PPT课件.ppt_第3页
《数据库》PPT课件.ppt_第4页
《数据库》PPT课件.ppt_第5页
已阅读5页,还剩66页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1,5.1 数据库系统概论 5.2 关系模型 5.3 关系规范化设计理论 5.4 数据库运行管理 5.5 数据仓库技术 本章小结,第五章 数据库技术,2,人工管理阶段 文件系统阶段 数据库系统阶段,随着计算机硬件和软件的发展,以及管理应用的需要,数据管理经历了如下发展阶段。,5.1 数据库系统概论,3,背景: 20世纪50年代中期前,计算机发展水平低 主要特点:数据是程序的组成部分,修改数据必须修改程序。处理时数据随程序一道送入内存,用完后全部撤出,不能保留。程序和数据的关系如下:,5.1 数据库系统概论 人工管理阶段,4,背景: 20世纪50年代后期到60年代中期,计算机硬件方面出现直接存取设备磁盘,软件方面出现了操作系统 主要特点:数据管理方面,数据被组织到文件内存储在磁带、磁盘上,可以反复使用和保存。程序与数据的关系如下:,5.1 数据库系统概论 文件系统阶段,应用程序1,应用程序2,应用程序n,数据组1,数据组2,数据组n,文件 管理系统,5,背景:20世纪60年代后期以来,计算机硬件方面出现大容量磁盘,软件方面出现数据库管理系统 主要特点:面向全组织的复杂数据结构。数据冗余度小,易于扩充。程序与数据的关系如下:,5.1 数据库系统概论 数据库阶段,6,数据库技术能克服传统文件组织中所产生的一系列问题。对数据库严格的定义是:数据库是众多有组织的数据的集合。数据库采用数据的集中管理,数据冗余很小。,7,.数据库管理系统 数据库管理系统(Database Management System,简称DBMS)允许一个组织将数据进行集中、有效地管理,并通过应用程序实现对数据的存取。DBMS是应用程序与物理的数据文件之间的接口,当应用程序要求得到某一数据项时,由DBMS来完成在数据库中对该数据项的查找,然后将结果提供给应用程序。若采用传统的数据文件,那么程序中必须定义数据,并告诉计算机数据在什么地方;而DBMS取消了在传统程序中的大部分数据定义的描述。,8,数据库管理系统的优点 通过对数据的存取、使用和安全的集中化管理降低了组织信息系统环境的复杂性; 减少了数据的冗余和不一致性; 消除了数据的混乱; 降低了程序对数据之间的依赖性; 大大降低了程序开发和维护成本; 极大地提高了信息系统的灵活性; 提高了信息的有效性和存取效率。,9,数据库管理系统功能: 数据定义:模式、子模式 数据操纵:更新、查询 数据组织、存储:内模式 数据库建立:数据加载,数据转换 数据库运行管理:安全性、完整性、并发控制、数据库恢复、数据库内部维护等,5.1 数据库系统概论 功能,10,数据库组织 (从计算机系统的观点对数据建模),目前采用的数据库模型主要有三种: 层次模型 网状模型 关系模型,11,1.层次数据模型 层次数据模型是DBMS最早使用的一种模型。它采用树型结构描述数据及数据项之间的关系。一条记录可以拥有多个下属记录,每个下属记录又可以拥有它自己的下属记录。从而构成由上向下的一对一或一对多联系。两个不同层次的记录之间的联系可以用“父记录”或“子记录”表示,位于高一层次的记录称做从属于该记录的下层记录的“父记录”,反之称做其所属上层记录的“子记录”;一条“父记录”可以对应多条“子记录”;而一条“子记录”只能有一条“父记录”;最顶层的记录称做“根记录”。,12,13,2.网状数据模型 网状数据结构是由层次数据结构变化而来的。事实上,数据库可以从层次结构转化为网状结构。层次结构描述的是一对多的关系,而网状结构描述的数据是多对多的关系。换言之,一个“父记录”能够拥有多个“子记录”,反之一个“子记录”也能够拥有多个“父记录”。,14,15,3.关系数据模型 关系数据模型是三种数据模型中出现最晚的一种模型,这种模型克服了其它两种模型的不足。关系模型将数据库中所有数据用多个简单的二维表来表示,这种表被称做关系表。图7.6给出了三个二维关系表,即供货商关系表、货品关系表、订货关系表。在每个二维关系表中,行代表记录数据;列表示字段。用户要形成一个报表需要综合多个二维表中的信息,通常一个二维关系与一个数据库文件相对应,因此一张报表中的数据将可能来自几个数据库文件。,16,17,4. 三种数据库模型的比较,18,关系型数据库管理系统对于信息查询具有很大的灵活性,且具有由不同来源组合信息的能力,设计维护简单,能在不打乱原有程序和应用的前提下增添新的数据和记录。其弱点是数据处理效率较前两种数据模型低。这种系统之所以有点慢是因为它们经常需要给出存取磁盘数据的路径,以便实现选择、连接和投影操作。在上百万数据中选择一个“货号”记录要耗费较长的时间。当然,通过对数据库进行索引,可使查询速度得到改善。已被广泛应用于大量事务处理应用中。,19,5.建立数据库 要建立一个数据库,需要经历两个设计阶段: 概念设计:就是从企业的角度形成数据库的抽象模型,概念设计则需要数据库最终用户的参与,对企业信息需求进行详尽的描述。 物理设计:则是描述数据库在直接存取的存储设备中是如何安排的。物理设计是由数据库专业人员完成的。,20,数据库设计人员用实体-关系图 (Entity-Relationship Diagram,简称E-R图) 来表达概念数据模型。(用文字和符号表示数据及其关系) 一般说来,在E-R图中有三种基本元素,即实体、联系和属性,它们分别用矩形框、菱形框和椭圆表示,并将对应名称填在框中以做标识。两个不同实体之间的联系分为1对1,1对多,或多对多(M代表多的意思)。在每个实体的属性描述中,带有下划线的属性是关键字段。,21,由于人们通常就是用实体、联系和属性这三个概念来理解现实问题的,所以实体-关系图非常接近人的思维方式,又因为它是采用简单的图形方式来表达人们对现实的理解,所以不熟悉计算机技术的用户也能够接受它。,22,实体关系模型,Entity Relationship Diagram 是描述数据属性及其关系的图型方法 实体:人、地点、物体、事件、概念等 实体属性:描述实体的数据项,姓名、地址等 关系:有关若干实体的活动(Process),订购等,5.1 数据库系统概论 E-R模型,23,5.1 数据库系统概论 E-R模型示例1,24,5.1 数据库系统概论 E-R模型示例2,25,3.由E-R图向关系模型转换的规则 一个实体转换为一个关系,实体的属性就是该关系的属性,实体的关键字就是该关系的关键字。 订货(订货编号,订货日期,交付日期,货号,金额) 一个联系也可以转换为一个关系,与该联系相连的各实体的关键字,以及联系的属性可转换为关系的属性。 若联系为1:1,则所连接的各实体关键字均是该关系的候选关键字。 若联系为1:N则, N端实体的关键字是该关系的候选关键字。 若联系为M:N 则关系的关键字为所连接的各实体的关键字的组合。,26,学生,性别,专业,电话,年龄,姓名,学号,课程,学时,学分,课名,课号,教师,职称,性别,姓名,工号,选修,讲授,成绩,地点,时间,M,N,H,K,学生(学号,姓名,性别,年龄,专业) 课程(课号,课名,学分,学时) 教师(工号,姓名,性别,职称,电话) 选修(学号,课号,成绩) 讲授(课号,工号,地点,时间),27,具有相同关键字的关系可以合并,订购 (订货编号,数量),订货 (订货编号,订货日期,交付日期,货号,金额),订货 (订货编号,订货日期,交付日期,货号,金额,数量),28,练习题: 某工厂生产多种产品,每种产品又要使用多种零件,一种零件可能安装在多种产品上。每种零件由一种材料制造,每种材料可用于不同零件的制作。有关产品、零件、材料的数据字段如下: 产品:产品号,产品名,产品单价 零件:零件号,零件名,单重,单价 材料:材料名,材料号,计量单位,单价 各产品使用各种零件数为:零件数量 各零件需要的材料数为:材料数量 请画出产品、零件、材料的E-R图。 将该E-R图转换为关系数据模型。,29,产品(产品号,产品名,产品单价) 材料(材料号,材料名,计量单位,单价) 安装(产品号,零件号,零件数量) 零件制造(零件号,零件名,单重,单价,材料号,材料用量),30,1.产品(产品号,产品名,产品单价) 2.零件(零件号,零件名,单重,单价) 3.材料(材料号,材料名,计量单位,单价) 4.安装(产品号,零件号,零件数量) 5.制造(零件号,材料号,材料数量),2+5: 零件制造(零件号,零件名,材料号,单重,单价,材料数量),31,产品(产品号,产品名,产品单价) 材料(材料号,材料名,计量单位,单价) 安装(产品号,零件号,零件数量) 零件制造(零件号,零件名,单重,单价,材料号,材料数量),32,学生登记表,Students,关系模型的数据结构是个二维表,5.2 关系模型 数据结构,33,结构化查询语言 (Structured Query Language,SQL) 是一种功能强大的数据库语言,用于完成数据库的操作任务。如数据更新、检索。,5.2 关系模型 数据操作,34,SELECT * FROM students WHERE Department=计算机 S_no S_name S_gender Department Age Place 95001 李勇 男 计算机 20 江苏 95004 张立 男 计算机 19 北京 95700 杨晓冬 男 计算机 21 山西 UPDATE students SET Age=20 WHERE S_no =95004 INSERT INTO students VALUES(95060, 王英,女 ,物理, 19,浙江),5.2 关系模型 数据操作示例,35,5.2 关系模型 完整性约束,实体完整性:若属性A是基本关系R的主属性,则属性A不能取空值 参照完整性:若属性(或属性组)F是基本关系R的外码,它与基本关系S的主码Ks相对应(基本关系R和S不一定是不同的关系),则对于R中每个元组在 F上的值必须为: 或者取空值(F的每个属性值均为空) 或者等于S中某个元组的主码值 用户定义的完整性: 针对某一具体关系数据库的约束条件,反映某一具体应用所涉及的数据必须满足的语义要求,返回,36,数据关系规范化理论:定义了五种规范化模式 (Normal Form,NF,简称范式)1971年E.F.Codd提出 范式表示的是数据关系模式的规范化程度,也即满足某些约束条件的关系模式。 在五种范式中,通常只用到前三种。,5.3 关系规范化设计理论 概念,37,1NF,First NF 元组中每一个分量都必须是不可分割的数据项。,不符合规范约束条件,5.3 关系规范化设计理论 举例1,38,处理后符合规范约束条件,5.3 关系规范化设计理论 举例1,1NF,First NF 元组中每一个分量都必须是不可分割的数据项。,39,2NF,Second NF 不仅满足第一范式,而且所有非主属性完全依赖于其主码。,主码为学号和课程号,而姓名仅依赖于学号,与课程号无关,非主属性对主码是部分依赖,5.3 关系规范化设计理论 举例2,40,将表进行分解为两个满足2NF的关系模式,5.3 关系规范化设计理论 举例2,2NF,Second NF 不仅满足第一范式,而且所有非主属性完全依赖于其主码。,41,NF,Third NF 不仅满足第二范式, 而且任何一个非主属性都不传递于任何主关键字。,系主任列通过系别传递依赖于主码学号,不满足3NF要求,5.3 关系规范化设计理论 举例3,42,NF,Third NF 不仅满足第二范式, 而且任何一个非主属性都不传递于任何主关键字。,处理后符合规范约束条件,5.3 关系规范化设计理论 举例3,返回,43,职工情况(工号,姓名,性别,年龄,技术级别,工资,学历,毕业年),44,45,配件(编号,名称,型号,供应商名称,供应商地址,单价,库存量),46,学生关系(学号,姓名,性别,年龄,系名,系主任,课程号,课程名,学分,成绩),配件(编号,名称,型号,供应商名称,库存量),供应商(供应商名称,供应商地址),配件价格(编号,供应商名称,单价),47,学生(学号,姓名,性别,年龄,系名,系主任,课程号,课程名,学分,成绩),练习题,2NF? 学生(学号,姓名,性别,年龄,系名,系主任) 课程(课程号,课程名,学分) 成绩(学号,课程号,成绩),3NF? 学生(学号,姓名,性别,年龄,系名) 系(系名,系主任) 课程(课程号,课程名,学分) 成绩(学号,课程号,成绩),48,数据库的安全性是指保护数据库防止非法使用数据库造成数据泄漏、更改或破坏。从技术方面,数据库安全模型如下:,应用系统,DBMS,OS,DB,用户标识和鉴定,存取控制,操作系统安全保护,密码存储,亦可以同时利用数据库的审计功能保障数据库的安全性,5.4 数据库运行管理 安全性,49,5.4 数据库运行管理 完整性1,数据库的完整性指数据的正确性和相容性 加在数据库中数据之上的语义约束条件称为完整性约束条件。 DBMS必须提供一种机制来检查数据库中的数据,看其是否满足语义规定的约束条件,50,(1),(2),(3),(4),(5),(6),静态列级约束,静态元组约束,静态关系约束,动态关系约束,动态元组约束,动态列级约束,列,元组,关系,静态,动态,对一个列的取值域的约束(数据类型等),规定组成一个元组的各个列之间的约束关系,各元组间或若干关系间存在的各种约束,修改列时应满足的约束条件,修改某个元组的值时,新旧值间该满足的约束条件,加在关系变化前后状态上的限制条件,5.4 数据库运行管理 完整性2,完整性约束条件,51,完整性控制机制 定义功能:提供定义完整性约束条件的机制 检查功能:检查用户发出的操作请求是否违背了完整性约束条件 执行功能:如果发现用户的操作请求使数据违背了完整性约束条件,则采取一定的动作来保证数据的完整性,5.4 数据库运行管理 完整性3,52,数据库是个共享资源,为了提高数据库的利用率,应允许多个用户并行地同时使用,但这样就会产生多个用户程序并发存取同一个数据的情况,如果不加以控制就可能破坏数据库的一致性 并发控制就是在多用户并发使用数据库时,保障数据的正确、有效、相容,5.4 数据库运行管理 并发控制,53,数据库运行过程中因可能发生的事务故障,系统故障,介质故障而使数据库遭到破坏。在数据库遭到破坏时可用恢复技术恢复数据库 数据库恢复所用的术是转储和记录日志文件 转储:DBA将整个数据库复制到磁带或另一个磁盘上保存起来的过程。转储的数据文件称为后援副本 日志文件:用来记录事务对数据库的更新操作的文件,5.4 数据库运行管理 恢复1,54,5.5 数据仓库技术 产生背景1,数据库系统作为数据管理手段,主要用于事务处理 尽管数据库在事务处理方面的应用获得了巨大的成功,但它对分析处理 的支持一直不能令人满意 OLTP面对的是操作人员和低层管理人员,OLAP 面对的是决策人员和高层管理人员,因而数据的特点和处理明显不同 事务处理与分析处理具有极不相同的性质,直接使用事务处理环境来支持OLAP是极困难的,55,OLTP,OLAP,5.5 数据仓库技术 产生背景2,56,OLTP数据 OLAP数据 原始数据 导出数据 细节数据 综合性或提炼性数据 当前数据 历史数据 可更新 不可更新,但周期性刷新 一次处理的数据量小 一次处理的数据量大 面向应用,事务驱动 面向分析,分析驱动 面向操作人员,支持日常操作 面向决策人员, 支持管理需要,OLAP与OLTP数据比较,5.5 数据仓库技术 产生背景3,57,数据仓库:是一个用于更好地支持企业或组织的决策分析处理、面向主题的、集成的、不可更新的、随时间不断变化的数据的集合 主题:是一个抽象的概念,在逻辑意义上它是对应企业中某一宏观分析领域所涉及的分析对象 面向主题的数据组织方式:是在较高层次上对分析对象所涉及的企业的各项数据,以及数据之间的联系,5.5 数据仓库技术 数据仓库定义,58,外部数据,经营数据,注:资料来源见讲义,经营数据,外部数据,加 载 管 理 器,查 询 管 理 器,仓库管理器,抽取 装载,引导 搜索,整理 转换 备份,数据,信息,分析决策,事实数据 维度数据,集合数据,元数据,数据仓库概念图,5.5 数据仓库技术 数据仓库概念,59,5.5 数据仓库技术 数据组织,60,数据集市是相当于部门级数据仓库的、小型的、面向部门或工作组的数据仓库 不同的数据集市可以按业务来组织,也可以按照数据仓库的主题或数据的地理分布来组织 数据集市中一般包含有关某一特定业务领域的数据,如人力资源、财务、销售、市场等 不同的数据集市可以分布在不同的物理平台上,也可以逻辑的分布于统一物理平台上,5.5 数据仓库技术 数据集市1,61,5.5 数据仓库技术 数据集市2,62,5.5 数据仓库技术 数据仓库系统结构,63,多维分析的基本分析动作 切片:在多维数组的某一维上选定一位成员 切块:在多维数组的某一维上选定某一区间的维成员 旋转:改变一个报告或页面显示的维方向 多维分析工具 多维查询工具:如 Business Objects (Business Analyzer) 多维处理工具:如 Powerplay, Commander 和 Pablo 以及 Essbase、 Dss Agent、lightship等 面向对象的产品:Information Advantage等,5.5 数据仓库技术 多维分析,64,A型1.5匹变频空调 4季度 徐汇门店 销售收入100万元,可以对主题进行分析:,中档百货店在12月份1.5匹变频空调是销售高峰,数量达到年平均的三倍。,5.5 数据仓库技术 多维分析示例,65,与数据仓库密切相关的是商务智能或商业智能。 Business Intelligent,BI 商务智能技术将商业活动数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论