等级四级数据库工程师考试重难点
等级考试四级数据库工程师考试重难点
第1章引言
1. 数据是描述现实世界事物的符号记录,是用物理符号记录下来的可以识别的信息
数据是信息的符号表示,是载体;信息是数据的语义解释,是内涵。
2. 数据模型是对现实世界数据特征的抽象,是数据库系统的形式框架,用来描述数据的一组概念和定义,包括描述数据、数据联系、数据操作、数据语义以及数据一致性的概念工具。
满足三条件:比较真实地模拟现实世界;易于人们理解;易于计算机实现
三个组成要素:数据结构(静态,数据对象本身结构及之间的联系)、数据操作(对数据对象操作及操作规则的集合)和完整性约束(语义约束:数据模型、数据内部及之间联系)3. 模式是对数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图,也称为逻辑模式或概念模式。
外模式是对数据库用户能够看见和使用的局部数据的逻辑结构和特征的描述,是与某一应用有关的数据的逻辑表示,也称为子模式、用户模式或用户视图。
内模式是对数据库中数据的物理结构和存储方式的描述,也称为物理模式或存储模式。
当数据库模式发生变化时,通过调整外模式/模式间的映像关系,使得应用程序不必随之修改,从而保证数据与应用程序间的逻辑独立性,简称数据的逻辑独立性。
当数据库数据的物理存储结构改变时,通过调整模式/内模式映像关系,保持数据库模式不变,使数据库系统的外模式和应用程序不随之改变,保证数据与应用程序间的物理独立性,简称数据的物理独立性。
4.数据库是存储在计算机内的共享数据集合,数据库管理系统是一种数据管理系统软件。数据库系统则是在计算机系统中引入数据库后的软硬件系统构成,包括了数据库、数据库管理系统和数据库应用程序。
5. DBMS的主要功能有数据定义、数据操纵、数据库运行管理与控制、数据库建立与维护。DBMS包括查询处理器和存储管理器。查询处理器实现面向用户的查询分析处理和优化功能。
存储管理器为用户和应用程序提供了访问存储在数据库文件中的应用数据的接口。
6.关系模型用二维表表示实体及实体之间的联系,现实世界中的每个客观对象对应表中的一行叫做一条记录,表中的每个列(属性)描述对象类的某一特征,列的值(属性的取值)刻画和描述客观对象的某一具体的特征。
四级查询优缺点:建立在“集合”“关系”上,严格成熟的理念基础;用关系表示实体及之间联系,简单易懂;存储路径透明,较好的数据独立性和安全保密性;查询效率低于非关系模型。
第2章数据库应用系统生命周期
2.1 软件生命周期是指软件产品从考虑其概念开始,到该产品不再使用的整个时期。一般包括概念阶段、需求阶段、设计阶段、实现阶段、测试阶段、安装部署及交付阶段、运行阶段与维护阶段。数据库应用系统需求是指用户对数据库应用系统在功能、性能、行为、设计约束等方面的期望和要求:数据及数据处理、业务、性能、其他存储安全备份与恢复等。
2.2 数据库应用系统生命周期模型
1.瀑布模型原理,项目规划、需求分析、系统设计、实现与部署、运行管理与维护五部分
2.快速原型模型和增量模型原理,允许渐进、迭代地开发DBAS。
3.根据DBAS的软件组成和各自功能,细化DBAS需求分析和设计阶段,引入了数据组织与存储设计、数据访问与处理设计、应用设计三条设计主线,分别用于设计DBAS中的数据库、数据库事务和应用程序。
4.设计阶段细分为概念设计、逻辑设计、物理设计三个步骤,每一步涵盖三条设计主线。
第3章需求分析及功能建模方法
3.1 数据元素(列)是数据处理中的最小单位。
3.2 DFD图:数据流(标有名字的箭头)、处理、数据存储(横圆柱)、数据源/终点(棱形)3.3 IDEF0图:更好地理解需求;ICOM(输入、控制、输出、机制)码;至少一个控制和输出箭头。A-0;A0(顶层图);A1;A11
3.4 DFD与IDEF0的比较:结构化分析思想:自顶而下逐级细化
1.DFD图用箭头也叫数据流来描述数据移动的方向、数据处理之间的数据依赖关系,IDEF0
图也用箭头表示数据流,但不强调流或顺序,强调数据约束,箭头语义更丰富。
2.DFD模型有四种元素,IDEF0图只有两种:箭头和活动
3.IDEF0图更加规范。其概念、建模方法、画图规则等均有说明和规定
4.IDEF0模型结构更清楚,便于理解和沟通
3.5 结构化分析及建模方法的优点:
1)不过早陷入具体的细节,从整体或宏观入手分析问题,如业务系统的总体结构,系统及子系统的关系。
2)通过图形化的模型对象直观地表示系统完成什么功能,方便系统分析员理解和描述系统。3)模型对象不涉及太多技术术语,便于用户理解模型。
第4章数据库概念设计与数据建模
4.1 概念设计的目的和任务:面向现实世界,理解和描述应用领域中的数据需求,分析确定
系统需要存储和处理什么数据。过程:确定实体集;确定联系和联系类型;建立由信息模型表示的业务模型;确定实体集属性;优化信息模型。
4.2 实体集描述具有相同属性特征和性质的事物集合;属性描述实体集具有的某一特征或性质4.3 IDEF1X:标定型(子依父实例才标定)(确定型);非标定型(确定型);分类;不确定
第5章关系数据库逻辑设计
5.1 关系数据库:按照二维表格组织和存储的相互关联的关系(表)的集合。
关系数据库采用关系模型在计算机中组织、存储、处理和管理数据。
5.2 主码约束:惟一性;最小性,不能取空值,并且取值要唯一
外码约束:如果两个关系R和S,X是R的属性或属性组,且X不是R的码,但X是S的码,则称X是R的外码。或者取空值,或者等于S中某个元组的主码的值。
5.3 逻辑设计的内容:定义和描述数据库的全局逻辑结构、数据之间的关系、数据的完整性
等目的:得到实际数据库管理系统可以处理的数据库模式。
步聚:ER图转化关系模式;优化关系模式;数据完整性设计;外模式设计
5.4 关系模式描述关系的静态结构,由模式名、属性、完整性约束组成,关系是一个表中记录的集合,关注和强调的是值(模式实例)的集合,也是关系模式在某一时刻状态的反映。
5.5 关系的完整性(完整性约束):对关系所满足条件的定义。作用:限定和检查数据库所含
实例的合法性和正确性。静态:主码、外码、域(用户定义);动态:基于业务规则
5.6 伪传递规则:X-Y,YW-Z,则XW-Z成立。
5.7 规范化设计理论的主要内容是范式,即关系模式满足的条件,它是数据库逻辑设计的指南,也是衡量关系模式设计优劣的标准。目的:消除数据冗余及避免操作异常,基本过程:对关系进行分解。一个低级范式的关系模式通过分解(投影)方法可转换成多个高一级范式的关系模式的集合,这个过程叫规范化。
5.8 1NF:R的每一属性均不可再分;
2NF:是1NF且每个非主属性完全依赖于主码。在1上消除非主属性对主码的部分函数依赖;3NF:是1NF且每个非主属性只依赖于主码。在2上消除非主属对主码的传递函数依赖。5.9 ER模型转换关系模型:实体集转为同名关系;联系转为一个关系,各实体集的码及联系的属性转为关系的属性(1:1均可、1:n取n、m:n取集);合并具有相同码的关系。
第6章存储技术与数据库物理设计
6.1 物理设计是在具体的硬件环境、OS、DBMS约束下,基于逻辑设计,设计具体数据存储结构和存取方式。目的:占用空间少、访问效率高、维护代价低。主要步骤有数据库逻辑模式调整、文件组织与存取设计、数据分布设计、安全模式设计、确定系统配置、物理模式评估。
6.2 索引技术(Indexing)是一种快速文件访问技术,它将文件记录在某个或某些域(或称为属性)上的取值与该记录的物理地址直接联系起来,提供了一种根据记录域的取值快速访问文件记录的机制。索引文件是一种利用索引技术支持快速文件访问的文件组织和存取方法。索引加快了查询记录却减慢了数据更新速度,本身还占用一定的存储空间。
6.3 文件组织:如何将关系数据库中的关系映射为操作系统中的数据库文件,及管理文件。文件结构:如何将DB文件中的逻辑记录映射到物理文件的中磁盘块。
文件存取:针对某种结构的DB文件,如何查、添删改其中的逻辑记录
6.4 数据字典:数据库各类对象的描述信息、数据库管理系统的控制信息。包括关系模式信息、与视图描述有关的信息、关系的存储结构和存取方法信息、完整性约束、安全性有关的信息、数据库运行统计信息。
发布评论