空间数据库期末复习重点总结.docx
- 文档编号:24567110
- 上传时间:2023-05-28
- 格式:DOCX
- 页数:30
- 大小:606.60KB
空间数据库期末复习重点总结.docx
《空间数据库期末复习重点总结.docx》由会员分享,可在线阅读,更多相关《空间数据库期末复习重点总结.docx(30页珍藏版)》请在冰豆网上搜索。
空间数据库期末复习重点总结
一、数据管理的发展阶段
1、人工管理阶段
2、文件系统阶段
3、数据库管理阶段
注意了解各阶段的背景和特点
二、数据库系统的特点
1、面向全组织的复杂的数据结构
2、数据的冗余度小,易扩充
3、具有较高的数据和程序的独立性:
数据独立性
数据的物理独立性
数据的逻辑独立性
三、数据结构模型三要素
1、数据结构
2、数据操作
3、数据的约束性条件
四、数据模型反映实体间的关系
1、一对一的联系(1:
1)
2、一对多的联系(1:
N)
3、多对多的联系(M:
N)
五、数据模型:
是数据库系统中用于提供信息表示和操作手段的形式构架。
数据库结构的基础就是数据模型。
数据模型是描述数据(数据结构)、数据之间的联系、数据语义即数据操作,以及一致性(完整性)约束的概念工具的集合。
概念数据模型:
按用户的观点来对数据和信息建模。
ER模型
结构数据模型:
从计算机实现的观点来对数据建模。
层次、网状模型、关系
六、数据模型的类型和特点
1、层次模型:
优点:
结构简单,易于实现
缺点:
支持的联系种类太少,只支持二元一对多联系
数据操纵不方便,子结点的存取只能通过父结点来进行
2、网状模型:
优点:
能够更为直接的描述世界,结点之间可以有很多联系
具有良好的性能,存取效率高
缺点:
结构比较复杂
网状模型的DDL、DML复杂,并且嵌入某一种高级语言,不易掌握,不易使用
3、关系模型:
特点:
关系模型的概念单一;(定义、运算)
关系必须是规范化关系;
在关系模型中,用户对数据的检索操作不过是从原来的表中得到一张新的表。
优点:
简单,表的概念直观,用户易理解。
非过程化的数据请求,数据请求可以不指明路径。
数据独立性,用户只需提出“做什么”,无须说明“怎么做”。
坚实的理论基础。
缺点:
由于存储路径对用户透明,存储效率往往不如非关系数据模型
4、面向对象模型
5、对象关系模型
七、三个模式和二级映像
1、外模式(Sub-Schema):
用户的数据视图。
是数据的局部逻辑结构,模式的子集。
2、模式(Schema):
所有用户的公共数据视图。
是数据库中全体数据的全局逻辑结构和特性的描述。
3、内模式(StorageSchema):
又称存储模式。
数据的物理结构及存储方式。
4、外模式/模式映象:
定义某一个外模式和模式之间的对应关系,映象定义通常包含在各外模式中。
当模式改变时,修改此映象,使外模式保持不变,从而应用程序可以保持不变,称为逻辑独立性。
5、模式/内模式映象:
定义数据逻辑结构与存储结构之间的对应关系。
存储结构改变时,修改此映象,使模式保持不变,从而应用程序可以保持不变,称为物理独立性。
八、数据视图
数据库管理系统的一个主要作用就是隐藏关于数据存储和维护的某些细节,而为用户提供数据在不同层次上的抽象视图,即不同的使用者从不同的角度去观察数据库中的数据所得到的结果—数据抽象。
九、规范化
1、几个概念
候选码(候选关键字):
如果一个属性(组)能惟一标识元组,且又不含有其余的属性,那么这个属性(组)称为关系的一个候选码(候选关键字)。
码(主码、主键、主关键字):
从候选码中选择一个唯一地标识一个元组候选码作为码
主属性:
任何一个候选码中的属性(字段)
非主属性:
除了候选码中的属性
外码:
关系模式R中属性或属性组X并非R的码,但X是另一个关系模式的码,则称X是R的外部码,简称外码。
2、函数依赖
(1)设R(U)是一个属性集U上的关系模式,X和Y是U的子集。
若对于R(U)的任意一个可能的关系r,r中不可能存在两个元组在X上的属性值相等,而在Y上的属性值不等,则称“X函数确定Y”或“Y函数依赖于X”,记作X→Y。
X称为这个函数依赖的决定属性集(Determinant)。
Y=f(x)
(2)在关系模式R(U)中,对于U的子集X和Y,
如果X→Y,但YX,则称X→Y是非平凡的函数依赖
若X→Y,但YX,则称X→Y是平凡的函数依赖
(3)在关系模式R(U)中,如果X→Y,并且对于X的任何一个真子集X’,都有X’/→Y,称Y完全函数依赖于X,记作XF→Y。
若X→Y,但Y不完全函数依赖于X,则称Y部分函数依赖于X,记作XP→Y。
(4)在关系模式R(U)中,如果X→Y,Y→Z,且YX,Y→X,则称Z传递函数依赖于X。
记为X传递→Z。
注:
如果Y→X,即X←→Y,则Z直接函数依赖于X。
3、范式
范式是符合某一种级别的关系模式的集合
(1)范式种类:
第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、BC范式(BCNF)、第四范式(4NF)、第五范式(5NF)
(2)各种范式之间的联系:
(3)定义:
1NF:
如果一个关系模式R的所有属性都是不可分的基本数据项,则R∈1NF。
存在的问题:
插入异常、删除异常、数据冗余度大、修改复杂
2NF:
若关系模式R∈1NF,并且每一个非主属性都完全函数依赖于R的码,则R∈2NF。
(所有非主属性完全依赖每个候选关键字。
)
3NF:
关系模式R中若不存在这样的码X、属性组Y及非主属性Z(Z\Y),使得X→Y,Y→Z成立,Y\→X,则称R∈3NF。
(所有非主属性既不部分依赖于码也不传递函数依赖码。
)
BCNF:
设关系模式R∈1NF,如果对于R的每个函数依赖X→Y,若Y不属于X,则X必含有候选码,那么R∈BCNF。
(每一个决定属性集(因素)都包含(候选)码,R中的所有属性(主,非主属性)都完全函数依赖于码,R∈3NF。
)
性质:
a、所有非主属性都完全函数依赖于每个候选码
b、所有主属性都完全函数依赖于每个不包含它的候选码
c、没有任何属性完全函数依赖于非码的任何一组属性
多值依赖:
设R(U)是一个属性集U上的一个关系模式,X、Y和Z是U的子集,并且Z=U-X-Y,多值依赖X→→Y成立当且仅当对R的任一关系r,r在(X,Z)上的每个值对应一组Y的值,这组值仅仅决定于X值而与Z值无关
平凡多值依赖和非平凡的多值依赖:
若X→→Y,而Z=φ,则称X→→Y为平凡的多值依赖,否则称X→→Y为非平凡的多值依赖。
4NF:
关系模式R(U,F)∈1NF,如果对于R的每个非平凡多值依赖XY(Y不包含于X),X都含有候选码,则R∈4NF
范式关系:
十、数据库
数据库:
数据库就是为了一定的目的,在计算机系统中以特定的结构组织、存储、管理和应用的相关联的数据集合。
空间数据库:
空间数据库是存取、管理空间信息的数据库。
空间数据库管理系统:
空间数据库管理系统是指能够对物理介质上存储的地理空间数据进行语义和逻辑上的定义;
1、提供必须的空间数据查询、检索和存取功能;
2、能够空间数据进行有效的维护和更新的一套软件系统。
空间数据库应用系统:
提供给用户访问和操作空间数据库的用户界面,是应用户数据处理需求而建立的具有数据库访问功能的应用软件。
一般需要进行二次开发。
数据库系统组成:
数据库、数据库管理系统、应用系统、数据库管理员
空间信息的特征:
(1)几何信息:
描述了事物在空间中的位置及所占据的范围
将地球表面以投影方式转换为平面
通过平面几何来抽象描述和研究事物的位置和范围
用图形和符号的方式来描绘这些空间相关的事物
(2)拓扑信息:
研究空间相关的事物本身或者事物之间的在空间坐标变换下的不变性质
事物本身的内外关系
事物之间的相离、相接、相交
事物之间相连的布局
(3)属性信息:
与位置范围无关的其它信息
描述了事物本身的内在性质和外在表现
事物之间的非位置关系
空间数据库管理系统三层体系结构及每层的代表软件:
标准DBMS存储空间数据的局限性
(1)空间数据记录是变长的(如点数的可变性),而一般的数据库都只允许把记录的长度设定为固定;
(2)在存储和维护空间数据拓扑关系方面存在着严重缺陷;
(3)一般都难以实现对空间数据的关联、连通、包含、叠加等基本操作;
(4)不能支持复杂的图形功能;
(5)单个地理实体的表达需要多个文件、多条记录,一般的DBMS也难以支持;
(6)难以保证具有高度内部联系的GIS数据记录需要的复杂的安全维护。
GIS的发展演化
空间数据库管理系统与传统数据库的区别:
(1)数据量大
(2)需要处理与传统数据库中数据性质相似的属性数据和空间位置数据及它们之间的联系
(3)对数据的检索涉及空间分析方法
(4)数据应用广泛,不局限于某个部门
GIS发展三个阶段
1、第一代GIS(从60年代中期到80年代的中后期,是GIS软件从无到有、从原型到产品的阶段)
技术特点:
以图层作为处理的基础
以系统为中心
单机、单用户
全封闭结构支持二次开发能力非常弱
在主要实现技术上,以文件系统来管理几何数据与属性数据
应用领域基本上集中在资源与环境领域的管理类应用
2、第二代GIS(从80年代末到90年代中期,是GIS软件成熟和应用快速发展的时期)
技术特点:
以图层作为处理基础
引入网络技术,多机、多用户
以系统为中心
支持二次开发的能力有所增强
以商用DBMS管理属性数据,但几何数据仍用文件系统管理
应用领域开始有较大范围的扩展,但基本上是管理类应用。
3、第三代GIS(90年代中期开始,估计将延续10年或稍长的时间)
技术特点:
仍然以图层为处理的基础,但面临不断演化
引入了Internet技术,开始向以数据为中心的方向过渡,实现了初步的(浏览型或简单查询型)的B/S结构
开放程度大幅度增加,组件化技术改造逐步完成
逐渐重视元数据问题,空间数据共享、服务共享和GIS系统互连技术不断发展
GIS的标准化问题备受重视
实现空间数据与属性数据的一体化存储和初步的一体化查询,并将不断完善
应用领域迅速扩大,应用深度不断提高,开始具有初步的分析决策能力。
展望新一代GIS
面向空间实体及其时空关系的数据组织与融合
统一的海量存储、查询和分析处理
有效的分布式空间数据管理和计算
一定的三维和时序处理能力
强大的应用集成能力
灵活的操纵能力和一定的虚拟现实表达
空间数据库管理系统与GIS的联系和区别
空间数据库管理系统一般由专业GIS软件提供
GIS—处理地理数据——以地球表面为基本参照框架的空间数据
SDBMS——处理空间数据(空间数据包括地理数据,地理数据是空间数据的子集)
GIS促进SDBMS的研究与发展
空间信息模型:
基于场的模型:
用于表示具有连续的空间变化的情况,形状不定的现象,采用栅格数据结构。
基于对象的模型:
用于表示具有固定形状的空间实体/概念,描述空间上离散的空间对象。
采用矢量数据结构
空间数据库设计的三个步骤
空间数据库的设计是指在现在数据库管理系统的基础上建立空间数据库的整个过程。
概念模型:
按用户的观点从现实应用中抽象出事物以及事物之间的联系
逻辑建模:
建立概念和联系的逻辑结构
物理设计建模:
对逻辑结构进行具体实现方面的安排和考虑;
存储组织、索引、内存管理……
E-R图:
实体:
现实中或者概念上独立存在的事物或者对象,用矩形表示
属性:
刻画实体性质的数值或描述,用椭圆表示
联系:
表达实体间的关联,用菱形表示
重点:
E-R图设计
扩展E-R模型:
象形图
1、实体象形图:
象形图:
象形图是一种将对象插在方框内的微缩图表示,这些微缩图用来扩展ER图,并插到实体矩形框中的适当位置。
形状:
形状是象形图中的基本图形元素,它代表着空间数据模型中的元素。
基本形状:
复合形状:
导出形状:
备选形状:
任意形状:
用户自定义形状:
2、联系象形图:
联系象形图用来构建实体间联系的模型
OGIS的4类几何体(4类空间数据模型):
点——0维对象
线——1维对象,线串——2个或多个点表示
面——2维对象,多边形
几何体集合——表示复杂形状,3类:
多点
多线
多面
几何体集合——保证——几何操作的闭合
常见拓扑属性:
endpoint(point,arc)点是弧的端点
simple-nonself-intersection(arc)非自交的弧
on-boundary(point,region)点在区域的边界上
inside(point,region)点在区域内部
outside(point,region)点在区域之外
open(region)区域是开域(不包括边界)
close(region)区域是闭域(包括边界)
connected(region)区域是连通域(区域上任2点,都有路径相连)
inside(point,loop)点在环中
crosses(arc,region)弧穿过区域
touches(region,region)区域与区域相邻
touches(arc,region)弧与区域相邻
overlap(region,region)区域与区域重叠
常见非拓扑属性:
Euclidean-distance(point,point)2点间的欧氏距离
direction(point,point)点在点的东面
length(arc)弧的长度(单位向量长度为1个单位)
perimeter(area)区域的周长(单位正方形的周长为4个单位)
area(region)区域的面积(单位正方形的面积为1个平方单位)
九交模型:
定义平面上2对象之间的拓扑关系
对象的3个部分:
内部——A°
边界——∂A
外部——A-
九交矩阵:
将两个几何形的内部、边界、外部分别两两做相交操作,操作的结果记为矩阵元素取值
矩阵元素取值:
0——交为空
1——交为非空
九交矩阵可确定的二元拓扑关系种类:
29=512
可实现的二元拓扑关系种类:
8(相离(disjoint)、相接(meet)、交叠(overlap)、相等(equal)、包含(contain)、在内部(inside)、覆盖(cover)、被覆盖(coveredby))
关系代数(形式化的语言)
关系代数用到的运算符包括四类:
集合运算符、专门的关系运算符、算术比较符、逻辑运算符。
并、差、交、笛卡尔积
选择:
满足条件的元组,即行
投影:
选取属性列
连接:
等值投影
自然连接(特殊的等值连接,要求两个关系中进行比较的分量必须是相同的属性组,在结果中把重复的属性列去掉)
外连接:
把舍弃的元组保存在结果中,在其他属性值上填空值(NULL)
左外连接:
保留左边关系要舍弃的元组
右外连接:
保留右边关系要舍弃的元组
除运算:
了解象集
SQL标准每阶段特点和增加的内容
SQL-86
SQL-89:
“具有完整性增强的数据库语言SQL”,增加了对完整性约束的支持
SQL-92:
“数据库语言SQL”,是SQL-89的超集,增加了许多新特性,如新的数据类型,更丰富的数据操作,更强的完整性、安全性支持等。
SQL-3/SQL99:
正在讨论中的新的标准,将增加对面向对象模型的支持
SQL中完成核心功能的9个动词
数据定义:
常用完整性约束:
主码约束:
primarykey
唯一性约束:
unique
非空集约束:
notnull
参照完整性约束
数据查询:
查询满足条件的元组:
%(百分号)代表任意长度(长度可以为0)的字符串
_(下横线)代表任意单个字符
集函数包括:
COUNT([DISTINCT|ALL]*)统计元组个数
COUNT([DISTINCT|ALL]<列名>)统计一列中值的个数
SUM([DISTINCT|ALL]<列名>)计算一列值的总和
AVG([DISTINCT|ALL]<列名>)计算一列的平均值
MAX([DISTINCT|ALL]<列名>)计算一列的最大值
MAX([DISTINCT|ALL]<列名>)计算一列的最小值
连接查询包括:
广义笛卡尔积
等值(含自然连接)
非等值连接;
自身连接;
外连接;
复合条件连接
嵌套查询
等值连接与自然连接区别
等值连接:
在连接条件中使用等于号(=)运算符比较被连接列的列值,其查询结果中列出被连接表中的所有列,包括其中的重复列。
自然连接:
在连接条件中使用等于(=)运算符比较被连接列的列值,但它使用选择列表指出查询结果集合中所包括的列,并删除连接表中的重复列。
嵌套查询分类:
不相关子查询:
子查询的查询条件不依赖于父查询
相关子查询:
子查询的查询条件依赖于父查询
不相关子查询:
由里向外逐层处理
相关子查询:
首先取外层查询中表的第一个元组,根据它与内层查询相关的属性值处理内层查询
集合查询:
并(union)交(intersect)差(minus)
SELECT语句的一般格式:
SELECT[ALL|DISTINCT]
<目标列表达式>[别名][,<目标列表达式>[别名]]…
FROM<表名或视图名>[别名]
[,<表名或视图名>[别名]]…
[WHERE<条件表达式>]
[GROUPBY<列名1>
[HAVING<条件表达式>]]
[ORDERBY<列名2>[ASC|DESC]
完整性规则:
实体完整性
参照完整性
用户定义的完整性:
对于有NOTNULL约束的属性列是否提供了非空值
对于有UNIQUE约束的属性列是否提供了非重复值
对于有值域约束的属性列所提供的属性值是否在值域范围内
数据更新:
插入数据:
INSERT
INTO<表名>[(<属性列1>[,<属性列2>…)]
VALUES(<常量1>[,<常量2>]…)
修改数据:
UPDATE<表名>
SET<列名>=<表达式>[,<列名>=<表达式>]…
[WHERE<条件>];
删除数据:
DELETE
FROM<表名>
[WHERE<条件>];
视图的特点
⏹虚表,是从一个或几个基本表(或视图)导出的表
⏹只存放视图的定义,不会出现数据冗余
⏹基表中的数据发生变化,从视图中查询出的数据也随之改变
视图操作:
(同表操作差不多)
定义视图
查询视图
更新视图
视图的可更新性:
SQLServer2000规定:
①如果一个视图是从多个基本表使用连接操作导出的,则不允许对这个视图执行更新操作。
②如果在视图定义中使用了聚集函数或DISTINCT短语或GROUPBY子句,则不允许对该视图执行更新操作。
③如果视图的列的值为表达式或常数,则不允许该这视图执行更新操作。
④如果视图为行列子集视图,则可以对该视图执行更新操作。
视图作用:
1.视图能够简化用户的操作
2.视图使用户能以多种角度看待同一数据
3.视图对重构数据库提供了一定程度的逻辑独立性
4.视图能够对机密数据提供安全保护
数据控制
SQL提供了数据控制功能,能在一定程度上保证数据的安全性、完整性、并提供了一定的并发控制和恢复能力。
1.完整性:
定义库结构
2.安全性:
存取控制,规定不同用户对于不同数据对象允许执行的操作,并控制各用户它有权存取的数据。
3.并发控制和恢复:
SQL支持事务、提交、回滚等概念。
功能:
1、权限
2、授权
GRANT<权限>[,<权限>]…
[ON<对象类型><对象名>]
TO<用户>[,<用户>]…[WITHGRANTOPTION];
3、收权
REVOKE<权限>[,<权限>]…
[ON<对象类型><对象名>]
FROM<用户>[,<用户>]…;
SQL语言的空间扩展
OGIS类中操作分3类
1、用于所有几何类型的基本操作6个
SpatialReference()返回几何体的基本坐标系统
Envelope()返回包含几何体的最小外接矩形
Export()返回以其他形式表示的几何体
IsEmpty()若几何体为空集,则返回真
IsSimple()若几何体为简单的(不自交的),则返回真
Boundary()返回几何体的边界
2、用于空间对象之间拓扑关系的操作测试8个
Equal相等——若2个几何体的内部和边界在空间上都相等,则返回真
Disjoint相离——若2个几何体的内部和边界都不相交,则返回真
Intersect交叠——若2个几何体相交,则返回真
Touch相接——若2个面仅边界相交,而内部不相交,则返回真
Cross横过——若一条线和面的内部相交,则返回真
Within在内部——若给定的几何体的内部不与另一个几何体的外部相交,则返回真
Contains包含——若给定的几何体包含另一个几何体,则返回真
Overlap覆盖/被覆盖——若2个几何体的内部有非空交集,则返回真
3、用于空间分析的一般操作7个
Distance求距离——返回2个几何体之间的最短距离
Buffer求缓冲区——返回到给定几何体距离小于等于指定值的几何体的点的集合
ConvexHull求最小闭包——返回几何体的最小闭包
Intersection集合交——返回2个几何体的交集构成的几何体
Union集合并——返回2个几何体的并集构成的几何体
Difference集合差——返回几何体与给定几何体不相交的部分
SymmDiff返回2个几何体与对方互不相交的部分
OGIS标准的局限性
局限用于——对象模型场模型的操作——正研究
仅支持——基本拓扑的、空间度量的操作
不支持——方位的、动态的、基于形状的、基于可见性的操作
数据字典
定义:
用于描述数据库的整体结构、数据内容和定义等。
一个好的数据字典可以说是一个数据的标准规范,它可使数据库的开发者依此来实施数据库的建立、维护和更新。
用途:
进行详细的数据收集和数据分析所获得的主要结果。
内容:
数据项、数据结构、数据流、数据存储、处理过程
空间索引
索引文件——用来提高数据文件查询效率的辅助文件
索引文件的组成:
2个域:
主码域
数据文件的页面地址
主索引——数据文件的记录按主码域排序,索引文件中只需保存数据文件的每个磁盘页面的第一个主码域的值。
一维搜索码的索引:
B树与B+树
多维索引:
类似散列表的结构
固定网格
网格文件
基于树形的结构
四叉树
R树
R+树
数据库查询语言
两种:
关系代数——形式化的语言
组成:
1种运算对象——关系(表)
6种运算——选择、投影、并、笛卡尔积、差、交
结构化查询语言(SQL)
事务的概念
事务是并发控制的基本单位。
所谓事务,就是一个操作序列,这些操作要么都执行,要么都不执行,它是一个不可分割的工作单位。
SQLServer以下列事务模式运行
(1)自动提交事务
(2)显式事务
(3)隐式事务
事务的特性
原子性
一致性
隔离性
持久性
语法格式为:
BEGINTRANSACTION
COMMITTRANSACTION
ROLLBACKTRANSACTION
锁的概念
锁定是MicrosoftSQLServerDatabaseEngine用来同步多个用户同时对同一个数据块的访问的一种机制。
锁的类型
(1)共享锁
共享锁也称为S锁,允许并行事务读取同一种资源,这时的事务不能修改访问的数据。
当使用共享锁锁定资源时,不允许修改数据的事务访问数据。
(2)排他锁
排他锁也称为
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 空间 数据库 期末 复习 重点 总结