高级数据库技术自考资料及高级英语2修辞总结文档格式.docx
- 文档编号:17386841
- 上传时间:2022-12-01
- 格式:DOCX
- 页数:28
- 大小:44.42KB
高级数据库技术自考资料及高级英语2修辞总结文档格式.docx
《高级数据库技术自考资料及高级英语2修辞总结文档格式.docx》由会员分享,可在线阅读,更多相关《高级数据库技术自考资料及高级英语2修辞总结文档格式.docx(28页珍藏版)》请在冰豆网上搜索。
数据查询和统计功能是指通过对数据库的访问,为实际应用提供需要的数据。
16.数据管理技术经历了手工管理、文件管理和数据库技术三个发展阶段;
数据库技术是20世纪60年代发展起来的数据管理技术。
17.数据管理在手工管理阶段具有4个特点:
(1)手工管理阶段不保存大量的数据
(2)手工管理阶段没有软件系统对数据进行管理(3)手工管理阶段基本上没有“文件”概念(4)手工管理阶段是一组数据对应一个程序。
18.文件管理阶段的数据管理具有4个特点:
(1)管理的数据以文件的形式长久地被保存在计算机的外存中
(2)文件系统有专门的数据管理软件提供有关数据存取、查询及维护功能(3)文件系统中的数据文件已经具有多样化(4)文件系统的数据存取是以记录为单位的。
19.文件系统在数据管理上的缺点:
(1)文件系统的数据冗余度大
(2)文件系统中缺乏数据域程序独立性(①文件系统中的数据文件是为某一特定应用服务的,数据文件的可重复利用率非常低②当数据的逻辑结构改变时,必须修改它的应用程序,同时也要修改文件结构的定义③应用程序的改变,如应用程序所使用的高级语言的变化等,也将影响到文件结构的变化)。
20.进入20世纪70年代后,数据库技术又有很大发展的表现:
(1)出现了许多商品化的数据库管理系统
(2)数据库技术为实现和优化信息系统的基本技术(3)关系方法的理论研究和软件系统的研制取得了很大成果。
21.数据库学科的研究内容:
(1)数据库管理系统软件的研制
(2)数据库设计技术的开发(3)数据库理论的研究。
22.数据库系统和文件系统相比具有的特点:
(1)数据库设计时面向数据模型对象
(2)数据库系统的数据冗余度小,数据共享度高(3)数据库系统的数据和程序之间具有较高的独立性(4)数据库管理系统通过DBMS进行数据安全性和完整性的控制(5)数据库数据的最小存取单位是数据项。
23.减少冗余数据的优点:
(1)数据量小可以节约存储空间,是数据的存储、管理和查询都容易实现
(2)数据冗余小可以使数据统一,避免产生数据的不一致问题(3)数据冗余小便于数据维护,避免数据统计错误。
24.数据共享度高的优点:
(1)系统现有用户或程序可以共同享用数据库中的数据
(2)当系统需要扩充时,在开发的新用户或新程序还可以共享原有的数据资源(3)多用户或程序可以在同一时刻共同使用同一数据。
25.在文件系统中,数据的最小存取单位是记录;
在数据库系统中,数据最小存取单位是数据项
26.在进行数据库硬件配置时,应注意的问题:
(1)计算机内存要尽量大
(2)计算机外存也要尽量大(3)计算机的数据传输速度要快。
27.数据库系统的软件中包括操作系统(OS)、数据库管理系统(DBMS)、主语言系统、数据库应用开发系统及工具、数据库应用系统和数据库
28.数据库系统的人员由软件开发人员、软件使用人员及软件管理人员组成;
软件开发人员包括系统分析员、系统设计员及系统程序设计员。
29.数据库管理员(DBA)的职责:
(1)数据库管理员应参与数据库和应用系统的设计
(2)数据库管理员应参与决定数据库的存储结构和存取策略的工作(3)数据库管理员要负责定义数据的安全性要求和完整性条件(4)数据库管理员负责监视和控制数据库系统的运行,负责系统的维护和数据恢复工作(5)数据库管理员负责数据库的改进和重组。
30.数据库中的数据独立性分为:
(1)数据的物理独立性
(2)数据的逻辑独立性。
31.在日常工作中,数据库管理员要负责记录数据库使用的“日志文件”,通过日志文件了解数据库的被使用和更改的情况。
32.数据库管理系统提供的主要功能:
(1)数据定义功能
(2)数据操纵功能(3)数据库的建立和维护功能(4)数据库的运行管理功能。
33.DML的两种形式:
(1)宿主型DML
(2)自主型DML。
34.DML的语言处理有两种方法:
(1)预编译方法
(2)增强编译方法。
35.数据库的三级模式是指逻辑模式(模式)、外模式(子模式)、内模式(存储模式或物理模式)。
36.使用子模式的优点:
(1)由于使用子模式,用户不必考虑那些与自己无关的数据,也无需了解数据的存储结构,使用户使用数据的工作和程序设计的工作都得到了简化
(2)由于用户使用的是子模式,使得用户只能对自己需要的数据进行操作,数据库的其他数据与用户是隔离的,这样有利于数据的安全和保密(3)由于用户可以使用子模式,而同一模式又可派生出多个子模式,所以有利于数据的独立性和共享性。
37.用户数据库、概念数据库和物理数据库三者的关系是:
概念数据库是物理数据库的逻辑抽象形式;
物理逻辑库是概念数据库的具体实现;
用户数据库是概念数据的子集,也是物理数据库子集的逻辑描述。
38.信息的三种世界是指现实世界、信息世界和计算机世界(也称数据世界或机器世界)。
39.数据项是对象属性的数据表示;
记录是实例的数据表示;
文件是对象的数据表示,是同类记录的集合;
记录结构及其记录联系的数据化的结果就是数据模型。
40.现实世界、信息世界和计算机世界的联系:
现实世界、信息世界和计算机世界这三个领域是由客观到认识、由认识到使用管理的三个不同层次,后一领域是前一领域的抽象描述;
现实世界的事物及联系,通过系统分析称为信息世界的信息模型,而信息模型经过数据化处理转化为数据模型。
41.数据库的概念模型也称信息模型。
42.数据库系统中最常用使用的数据模型是层次模型、网状模型和关系模型;
层次模型和网状模型统称为非关系模型。
43.数据模型的三要素:
数据结构、数据操作和完整性约束条件。
44.多对多的联系分解成一对多的联系的分解方法:
冗余结点法和虚拟结点法。
优缺点:
冗余结点法的优点是结构清晰,允许结点改变存储位置;
缺点是占用存储空间大,有潜在的不一致性。
虚拟结点法的优点是占用存储空间小,能够避免潜在的不一致性问题;
缺点是结点改变存储位置时可能引起虚拟结点指针的改变。
45.层次模型的数据存储一般使用邻接存储法和链接存储法(子女-兄弟链接法和层次序列链接法)实现。
46.层次模型的数据操作主要是数据的查询、插入、删除、修改。
47.层次模型的完整性约束条件:
(1)在进行插入记录值操作时,如果没有指明相应的双亲记录值,则不能插入子女记录值
(2)进行删除记录操作时,如果删除双亲记录值,则相应的子女不结点值也同时被删除(3)进行修改记录操作时,应修改所有相应记录,以保证数据的一致性。
48.网状数据模型常用的存储方法是链接法,它包括单向链接、双向链接、环状链接、向首链接等。
此外,网状数据模型还用其他的存储方法,如指引元阵列法、二进制阵列法、索引法等。
49.网状数据和层次数据比较,双方各有优缺点:
(1)层次模型的的主要优缺点。
层次模型的主要优点是:
数据模型本身比较简单;
系统性能优于关系模型和网状;
能够提供良好的完整性支持★层次模型的主要缺点是:
在表示非层次性的联系时,只能通过冗余数据或创建非自然的数据组织来解决;
对插入和删除操作的限制比较多;
查询子女结点必须通过双亲结点;
由于结构严密,层次命令趋于程序化
(2)网状数据模型的主要优点有:
能够更直接地描述现实世界,一个结点可以有多个双亲,允许符合链,具有良好的性能,存取效率比较高★层次模型的主要缺点是结构比较复杂,而且随着应用环境的扩大,数据库的结构就变得越来越复杂,不利用用户掌握;
DDL和DML语言复杂,用户不容易使用;
由于记录之间联系是通过存取路径实现的,应用程序在访问数据库时必须适当的存取路径,因此,用户必须了解系统结构的细节后才能实现其数据存取,程序员要为访问数据设置存取路径,加重了编写应用程序的负担。
50.关系,一个关系对应通常所说的一张二维表;
元组,表中的一行称为一个元组,许多系统中把元组称为关系;
属性,表中的一列称为一个属性;
码,表中的某个属性或属性组,它们的值可以唯一地确定一个元组,且属性组中不含多余的属性,这样的属性或属性组称为关系的码;
域,属性的取值范围;
分量,元组中的一个属性值称为分量;
关系模式,关系的型称为关系模式,关系模式是对关系的描述。
51.关系的完整性约束条件:
实体完整性、参照完整性和用户定义的完整性。
52.在关系数据库的物理组织中,关系以文件形式存储。
53.与非关系数据模型相比,关系数据模型的特点:
(1)关系数据模型建立在严格的数据基础之上
(2)关系数据模型的概念单一,容易理解(3)关系数据模型的存取路径对用户隐藏(4)关系模型中的数据联系是靠数据冗余实现的。
54.数据库系统的设计包括数据库设计和数据应用系统设计两方面的内容。
55.概念结构的特点:
(1)概念模型是现实世界的一个真实模型
(2)概念模型应当易于理解(3)概念模型应当易于更改(4)概念模型应易于向数据模型转换。
56.数据库系统设计的内容主要有:
数据库的结构特性设计,数据库的行为特性设计,数据库的物理模式设计。
57.进行数据库系统设计时,应注意的问题:
(1)进行数据库系统设计时应考虑计算机硬件、软件和干件的实际情况
(2)数据库系统设计时应使结构特性设计和行为特性设计紧密结合。
58.新奥尔良(NewOrleans)方法将数据库设计分为4个阶段:
需求分析、概念设计、逻辑设计和物理设计。
★其后,许多科学家进行了改进,认为数据库设计应分6个阶段进行:
需求分析、概念结构设计、逻辑结构设计、物理结构设计、数据库实施和数据库运行和维护。
★在数据库设计不同阶段上,实现的具体方法有基于E-R模型的数据库设计方法、基于3NF(第3范式)的设计方法、基于抽象语法规范的设计方法等。
59.需求分析的主要任务是:
详细调查现实世界要处理的对象(组织、部门、企业等);
充分了解系统的概况和发展前景;
明确用户的各种需求;
收集支持系统目标的基础数据及其处理方法;
确定新系统的功能和边界。
60.在系统需求调查过程中,常用的调查方法:
(1)跟班作业
(2)开调查会(3)请专人介绍(4)查询(5)请用户填写设计调查表(6)查阅数据记录。
调查中还需要查阅与原系统有关的数据记录,包括账本、档案或文献等。
61.数据字典通常包括以下5个部分:
(1)数据项(数据项是不可再分的数据单位)
(2)数据结构(3)数据流(4)数据存储(5)处理过程。
62.概念结构设计的方法有4种:
(1)自顶向下的设计方法
(2)自底向上的设计方法(3)逐步扩张的设计方法(4)混合策略设计的方法。
63.数据抽象的三种基本方法是分类、聚集和概括。
64.设计分E-R图的具体做法是:
(1)选择局部应用
(2)设计分E-R图。
65.为了简化E-R图,在调整中应当遵循的一条原则:
现实世界的事物能作为属性对待的尽量作为属性对待。
在解决这个问题时应当遵循两条基本准则:
(1)“属性”不能在具有需要描述的性质
(2)“属性”不能与其他实体具有联系。
66.视图的集成可以有两种方法:
一种方法是多个分E-R图一次集成;
另一种方法是逐步集成,用累加的方法一次集成两个分E-R图。
无论采用哪种方法,在每次集成局部E-R时,都要分两步进行:
(1)合并E-R图
(2)修改和重建初步E-R图。
67.分E-R图之间的冲突主要有3类:
属性冲突、命名冲突和结构冲突。
68.属性冲突主要有以下两种情况:
(1)属性域冲突
(2)属性取值单位冲突。
69.命名冲突主要有以下两种:
(1)同名异义冲突
(2)异名同义冲突。
70.结构冲突有以下3中情况:
(1)同一对象在不同的应用中具有不同的抽象
(2)同一实体在不同分E-R图中的属性组成不一致(3)实体之间的联系在不同的分E-R图中呈现不同的类型。
71.消除了冗余的初步E-R图就称为基本E-R图。
72.分析方法是消除冗余的主要方法。
分析方法消除冗余是以数据字典和数据流程图为依据,根据数据字典中关于数据项之间逻辑关系的说明来消除冗余的。
73.通常把概念模型向逻辑模型转换的过程分为3步进行:
(1)把概念模型转换成一般的数据模型
(2)将一般的数据模型转换成特定的DBMS所支持的数据模型(3)通过优化方法将其转化为优化的数据模型。
74.1:
1联系的转换方法:
(1)单独转换为一张表
(2)在任一端进行合并;
1:
n联系的转换方法:
(1)产生一张表的关系
(2)与n方实体进行合并;
m:
(1)产生一张表。
75.用户子模式也称外模式。
用户子模式设计时应注意以下问题:
(1)使用更符合用户习惯的别名
(2)对不同级别的用户可以定义不同的子模式(3)简化用户对系统的使用。
76.关系数据库常用的存取方法有索引方法、聚簇方法和HASH方法等。
77.选择索引方法的基本原则是:
(1)如果一个属性经常出现在查询条件中出现,则考虑在这个属性上建立索引;
如果一组属性经常在查询条件中出现,则考虑在这组属性上建立组合索引
(2)如果一个属性经常作为最大值和最小值等聚集函数的参数,则考虑在这个属性上建立索引(3)如果一个属性经常在连接操作的连接条件中出现,则考虑在这个属性上建立索引(4)关系上定义的索引数要适当,并不是越多越好,因为系统为维护索引付出代价,查找索引也要付出代价。
78.为了提高某个属性或属性组的查询速度,把这个属性或属性组上具有相同值的元组集中存放在连续的物理块上的处理称为聚簇,这个属性或属性组称为聚簇码。
79.设计候选聚簇的原则是:
(1)对经常在一起进行连接操作的关系可以建立聚簇
(2)如果一个关系的一组属性经常出现在相等、比较条件中,则该单个关系可建立聚簇(3)如果一个关系的一个(或一组)属性上的值重复率很高,则此单个关系可建立聚簇(4)如果关的主要应用是通过聚簇码进行访问或连接,而其他属性访问关系的操作很少时,可以使用聚簇。
80.检查候选聚簇,取消其中不必要关系的方法是:
(1)从聚簇中删除经常进行全表扫描的关系
(2)从聚簇中删除更新操作远多于连接操作的关系(3)不同的聚簇中可能包含相同的关系,一个关系可以在某一个聚簇中,但不能同时加入多个聚簇。
81.建立聚簇应注意的问题:
(1)聚簇虽然提高了某些应用的性能,但是建立与维护聚簇的开销是相当大的
(2)对已有的关系建立聚簇,将导致关系中的元组移动其物理存储位置,这样会使关系上原有的索引无效,要想使用原索引就必须重建原有索引(3)当一个元组的聚簇码值改变时,该元组的存储位置也要做相应移动,所以聚簇码值应当相对稳定,以减少修改聚簇码值所引起的维护开销。
82.确定数据的存放位置和存储结构要综合考虑存取时间、存储控件利用率和维护代价三方面的因素。
83.有多个磁盘的计算机,可以采用下面几种存取位置的分配方案:
(1)将表和索引放在不同的磁盘上,这样在查询时,由于两个磁盘驱动器并行工作,可以提高物理I/O读写的效率
(2)将比较大的表分别放在两个磁盘上,以加快存取速度,这在多用户环境下特别有效(3)将日志文件、备份文件与数据库对象放在不同的磁盘上,以改进系统的性能(4)对于经常存取或存取时间要求高的对象应放在高速存储器上,对于存取频率小或存取时间要求低的对象,如果数据量很大,可以存放在低速存储设备上。
84.数据库维护工作包括以下4项:
(1)数据库的转储和恢复
(2)数据库的安全性、完整性控制(3)数据库性能的监督、分析和改造(5)数据库的重组织与重构造。
85.根据数据库系统的构造方式,可以把数据库系统分为桌面型数据库系统、两层结构的数据库系统和多层结构的数据库系统3种类型。
86.两层结构的数据库系统有两种构造方式:
客户机/服务器(C/S)结构和浏览器/服务器(B/S)结构。
87.当系统规模增加到一定程度时,两层结构的数据库系统就暴露的缺陷:
(1)启动的客户机端程序或打开的浏览器越多,同数据库服务器建立的连接就会越多,服务器端的负担就会越重
(2)由于客户机端在分发程序时不仅要分发EXE文件,还要分发与数据访问及数据管理相关的动态链接库,,所以如果客户机的地理位置比较分散,则客户端程序就难以发现(3)一旦数据库服务器的软硬件出现问题,所以前端的应用都将会终止。
88.系统设计主要包括系统功能分析、系统模块设计以及开发与运行环境的选择三大任务。
89.关系数据库中的关系可以分为基本表、视图表和查询表三种类型。
90.关系数据库中的基本表具有以下6个性质:
(1)同一属性的数据具有同质性
(2)同一关系的属性名具有不能重复性(3)关系中的列位置具有顺序无关性(4)关系具有元组无冗余性(5)关系中的元组位置具有顺序无关性(6)关系中每一个分量都必须是不可分的数据项。
91.关系操作包括数据查询、数据维护和数据控制三大功能。
92.数据查询指数据检索、统计、排序、分组以及用户对信息的需求等功能;
数据维护指数据增加、删除、修改等数据自身更新的功能;
数据控制是为了保证数据的安全性和完整性而采用的数据存取控制及并发控制等功能。
93.关系操作操作的数据查询和数据维护功能使用关系代数中的选择、投影、连接、除、并、交、差和广义笛卡儿积8种操作表示,其中前4种为专门的关系运算,而后4种为传统的集合运算。
94.关系模型中有三类完整性约束:
95.关系操作具有以下3个明显的特点:
(1)关系操作语言操作一体化
(2)关系操作的方式是一次一集合方式(3)关系操作语言是高度非过程化的语言。
96.其他系统的操作是一次一记录方式,而关系操作的方式则是一次一集合方式,即关系操作的初始数据,中间数据和结果数据都是集合。
97.关系操作语言可以分为以下3类:
(1)关系代数语言(ISBL为关系代数语言的代表)
(2)关系演算语言(3)基于映像的语言。
98.关系代数所使用的运算符包括4类:
集合运算符、专门的关系运算符、比较运算符和逻辑运算符。
(1)集合运算符:
U(并运算),—(差运算),∩(交运算),×
(广义笛卡儿积)
(2)专门的关系运算符:
σ(选择),π(投影),l×
l连接,÷
(除)(3)比较运算符:
>
(大于)≥(大于等于),<
(小于),≤(小于等于),=(等于),≠(不等于)(4)逻辑运算符:
┐(非),^(与),V(或)。
99.关系代数可分为传统的集合运算和专门的集合运算两类操作。
100.元组关系演算语言ALPHA语言语句的基本格式是:
操作语句工作空间名(表达式):
操作条件基本格式中:
操作语句主要有GET、PUT、HOLD、UPDATE和DROP六条语句;
工作空间是用户与系统的通信区,它可以用一个字母表示,通常用W表示;
表达式用于指定语句的操作对象,它可以是关系名和属性名,一条语句可以同时操作多个关系或多个属性;
操作条件是一个逻辑表达式,它用于将操作结果限定在满足条件的元组中,操作条件可以为空;
可以在基本格式的基础上加上排序要求,定额要求等。
101.元组关系演算语言ALPHA中提供的集函数:
COUNT():
对元组记数TOTAL():
求总和MAX():
求最大值MIN():
求最小值AVG():
求平均值。
102.域关系演算语言QBE具有以下特点:
(1)QBE是交互式语言
(2)QBE是表格语言(3)QBE是基于例子的查询语言。
103.域关系演算语言QBE提供的集函数:
CNT统计元组数SUM:
求数值表达式的总和AVG:
求数值表达式的平均值MAX:
就表达式中的最大值MIN:
求表达式的最小值。
104.SQL的主要功能:
(1)数据定义功能
(2)数据操纵功能(3)数据控制功能。
105.语句格式约定符号:
语句格式中,尖括号“<
”中为实际语义;
中括号“[]”中的内容为任选项;
大括号“{}”或用分隔符“|”中的内容为必选项,即必选其中之一项;
[,…n]表示前面的项可重复多次。
106.一般语法规定:
SQL中的数据项(包括列项,表和视图)分隔符为“,”,其字符串常数的定界符用单引号“‘”表示。
107.SQL特殊语法规定:
SQL的关键词一般使用大写字母表示;
SQL语句的结束符为“;
”。
108.索引的作用:
(1)使用索引可以明显地加快数据查询的速度
(2)使用索引可保证数据的唯一性(3)使用索引可以加快连接速度。
109.用SQL建立学生-课程库中的基本表,其表结构为:
学生(学号,姓名,年龄,性别,所在系);
课程(课程号,课程名,先行课)。
选课(学号,课程号,成绩)
Createtable学生(学号char(5)notnullunique,
姓名char(8)notnull,
年龄smallintdefault20,
性别char
(2),
所在系char(20),
ConstraintC2chack(性别in(‘男‘,’女‘)));
Createtable课程(课程号char(5)primarykey,
课程名char(20),
先行课char(5));
Createtable选课(学号char(5),
课程号char(5),
成绩smallint,
ConstraintC3check(成绩between0and100),
ConstraintC4primarykey(学号,课程号),
ConstraintC5foreingkey(学号)references学生(学号),
ConstraintC6foreingkey(课程号)references课程(课程号));
110.建立索引的原则:
(1)索引的的建立和维护有DBA和DBMS完成
(2)大表应当建索引,小表则不必建索引(3)对于一个基本表,不要建立过多的索引(4)根据查询要求建立索引。
111.视图的优点:
(1)视图能够简化用户的操作
(2)视图机制可以是用户以不同的方式看待同一数据(3)视图对数据库的重构提供了一定程序的逻辑独立性(4)视图可以对机密的数据提供安全保护。
112.SQL的数据查询语句中包括s
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 高级 数据库技术 自考 资料 英语 修辞 总结