GIS空间数据模型与结构研究.docx
- 文档编号:30740171
- 上传时间:2023-08-20
- 格式:DOCX
- 页数:38
- 大小:189.82KB
GIS空间数据模型与结构研究.docx
《GIS空间数据模型与结构研究.docx》由会员分享,可在线阅读,更多相关《GIS空间数据模型与结构研究.docx(38页珍藏版)》请在冰豆网上搜索。
GIS空间数据模型与结构研究
目录
摘要................................................................1
引言................................................................1
1空间数据........................................................1
1.1来源......................................................1
1.2分类......................................................2
2空间数据模型研究................................................2
2.1空间数据模型概念.........................................2
2.2GIS空间数据模型分类及其基本问题..........................3
2.2.1概念数据模型.......................................3
2.2.2逻辑数据模型.......................................7
2.2.2.1层次数据模型.................................7
2.2.2.2网络数据模型.................................9
2.2.2.3关系数据模型................................10
2.2.2.4面向对象数据模型............................12
2.3GIS空间数据模型的学术前沿...............................14
2.3.1时空数据模型......................................15
2.3.2动态空间数据模型..................................15
2.3.3三维空间数据模型..................................16
2.3.4分布式空间数据模型................................17
3空间数据结构研究...............................................18
3.1空间数据结构定义.........................................18
3.2空间数据结构的分类.......................................18
3.3矢量数据结构.............................................20
3.3.1定义..............................................20
3.3.2矢量数据的拓扑关系................................20
3.3.3无拓扑关系的矢量数据..............................22
3.3.4矢量数据间的融合..................................23
3.4栅格数据结构.............................................24
3.4.1压缩编码存储结构..................................24
3.4.2栅格结构和矢量结构的相互关系......................26
3.4.3失栅一体化结构....................................27
3.4.4发展趋势..........................................28
结语...............................................................29
参考文献...........................................................30
GIS空间数据模型与结构研究
王乐乐,吴博,张莉,陈丽红
【摘要】:
空间数据模型和空间数据结构是地理信息系统(GIS)课题的中心内容。
本文对空间数据模型和结构的定义、分类以及发展中的问题与解决方法进行了一定的研究性的归纳与总结。
【关键词】:
GIS,空间数据模型,空间数据结构
1引言
GIS是围绕空间数据的采集、加工、存储、分析和表现展开的计算机系统。
空间数据的采集方法、生产工艺、数据的质量都直接影响到GIS应用的潜力、成本和效率。
作为GIS的核心,空间数据的结构与模型直接影响着GIS的运用和发展。
合理的空间数据结构和模型能使GIS达到最优化,使生产效益达到最大化。
因此,如何完善和改进空间数据结构和模型一直是能否推动GIS不断发展和更新的核心任务。
本文对GIS空间数据结构和模型的传统意义和现今发展做了一些初步研究,旨在为GIS空间数据的研究提供一定参考。
1空间数据
1.1来源
随着GIS系统的广泛应用,地理空间数据的内容也在不断增加,由于应用目的不同,使用的数据在内容和结构上也有很大的区别。
由于行业的需求不同,地理空间数据的侧重点和要求也有很大的区别,GIS的数据来源主要有如下几种[1,18]:
1)航空航天遥感
遥感技术是从远距离感知目标反射或自身辐射的电磁波、可见光、红外线结合目标进行探测和识别的技术。
遥感数据是地理信息系统的重要数据来源。
2)地图数字化
地图数字化就是通过GIS工具,把纸质地图经过一系列处理转换成可以在屏幕上显示的电子化地图。
地图数字化主要有数字化仪手持跟踪数字化和扫描矢量化两种方法。
3)全野外数据采集
全野外数据采集就是应用现代测量技术采集GIS数据,全野外数据采集的GIS数据具有现势性好,精度高的特点。
全野外数据采集的方法主要有GPS数据采集、全站仪数据采集、光电测距仪配合计算机进行数据采集及经纬仪配合其它设备进行数据采集等多种数据采集方法。
4)合成孔径雷达
合成孔径雷达就是利用雷达与目标的相对运动把尺寸较小的真实天线孔径用数据处理的方法合成一较大的等效天线孔径的雷达。
合成孔径雷达的特点是分辨率高,能全天候工作,能有效地识别伪装和穿透掩盖物。
既可详细、较准确地观测地形、地貌等地球表面的信息又可收集地表下面的信息,它是空间对地观测的一种有效手段。
5)近景摄影测量
近景摄影测量和全野外数据采集一样是获取一定区域内地理信息的主要方法,它能解决遥感信息在局部区域的精确表示,也能解决地图数字化的时效问题。
6)其它数据
这类数据有文本资料、多媒体数据、试验数据、理论推算与估算数据、历史数据、统计普查数据等。
1.2分类
从概念上分,地理空间数据可分为两大类。
一类是空间对象数据,它是指具有几何特征和离散特点的地理要素,如点对象、线对象、面对像、体对象等。
另一类是场对象数据,它是指在一定空间范围内连续变化的地理对象,如覆盖某一地理空间的格网数字高程模型、不规则三角网、栅格影像数据等。
每个离散的空间数据对象有一个唯一的对象标识或相应的属性扫描信息。
一个场对象通常作为一个整体,场内的局部特征已经由构造该数据场的节点特征表达,如一个格网点的高程表现了该点的高度。
由于离散的空间对象与场对象的特征不同,所以需要采用不同的方法进行处理和管理。
根据地理实体数字描述方式的不同,空间数据可分为矢量数据和栅格数据。
矢量数据是在直角坐标系中,用X、Y坐标表示地图图形或地理实体的位置和形状的数据。
矢量数据一般通过记录坐标的方式来尽可能将地理实体的空间位置表现的准确无误。
栅格数据是按网格单元的行与列排列、具有不同灰度或颜色的阵列数据。
2空间数据模型研究
2.1空间数据模型概念
空间数据模型是关于现实世界中空间实体及其相互联系的概念,它为描述空间数据的组织和设计空间数据库模式提供基本方法[2]。
一个空间数据模型可以被定义为一组有关关系联系在一起的实体集。
一个实体是存在的和可区别的,即可以从众多实体中区别某一个。
如,汽车、河流等都是实体。
空间数据模型是在实体概念上发展起来的,它包含两个基本内容:
专门的实体组和它们之间的相关关系,实体及相关关系可以通过属性和性质来说明,存储在实体的属性中[3]。
2.2GIS空间数据模型分类及其基本问题(评价)
GIS空间数据模型由概念数据模型、逻辑数据模型和物理数据模型三个层次所组成,其中概念数据模型是关于实体及实体间联系的抽象概念集,逻辑数据模型表达概念数据模型中数据实体(或记录)及其间关系,而物理数据模型则是描述数据在计算机中的物理组织、存取路径和数据库结构。
下面将重点介绍概念及逻辑层面上的GIS空间数据模型。
2.2.1概念数据模型
GIS空间数据模型的概念模型是考虑用户需求的共性,用统一的语言描述和综合、集成各用户视图。
其基本任务是,确定所感兴趣的现象和基本特性,描述实体间的相互联系,从而确定空间数据库的信息内容。
目前广为采用的是基于平面图的点、线、面数据模型和基于连续铺盖(Tessellation)的栅格数据模型[4]。
基于平面图的点、线、面数据模型是一种面向空间实体的模型,其把现实世界的空间实体抽象地看作是由平面上的点、线、面空间目标(Spatialobjects)组成的。
这些点、线、面空间目标之间存在着一些空间关系,如点、线、面目标与其组成弧段、结点、坐标之间的相交(Junction)、连接(Connection)、连通(Connectivity)和包容(Containment)等拓扑空间关系。
基于平面图的点、线、面数据模型的一个核心问题是描述和表达点、线、面空间目标及其相互间的拓扑空间关系。
基于连续铺盖的栅格数据模型是将连续空间离散化,即用二维铺盖或面片覆盖整个连续空间;铺盖可分为规则和不规则的,后者可当做拓扑多边形处理,如社会经济分区、城市街区;铺盖的特征参数有尺寸、形状、方位和间距。
对同一现象,也可能有若干不同尺度、不同聚分性(Aggregationorsubdivisions)的铺盖。
实体--关系法是建立空间概念数据模型时采用的主要方法。
其认为现实世界中具有相似性质的实体组成实体类(Entitytype),单个实体或实体类之间存在着多种关系,这种关系可以是一对一的,也可能是多对多的。
如道路这一实体穿过城市,对同一城市而言一般有N条道路穿过,表现为ER模型中的1:
N关系。
此外,实体和关系都有属性。
对于一个街区来说,其中一街道有若干路段,一个路段有若干边组成,而每一地块的边界可能有M个边组成。
空间实体的点、线、面之间存在的一些关系也可以用ER方法表示。
如果将某些实体进一步分类的话,则得到ECR模型(Entity-Category-RelationshipModel)。
前述的两种空间概念数据模型在描述、表达现实世界空间实体及其相互关系和进行动态模拟方面,均表现出一定的局限性,存在着一些有待解决的问题:
(l)面向实体法和铺盖法是表达连续空间的两种基本方法,各有其特点。
如规则铺盖用于表征连续空间,而不是空间实体的特征或位置,且不直接考虑拓扑空间关系。
出于精度的考虑,一般不用规则铺盖表达曲状要素和不规则多边形。
而面向空间实体的点、线、面模型适于表达曲状要素和不规则多边形。
在实际应用中,往往需要将两者结合起来。
例如,在城乡规划管理的过程中,由于规划管理的对象、内容、阶段的不同,往往涉及到多种不同形式的数据资料。
从数据处理和管理的角度来看,其不仅需要统一地存贮管理多种数据结构的空间数据,而且要求综合运用矢量、栅格等多种空间数据处理办法,因此单一数据结构的GIS工具往往难以满足城乡规划管理对空间数据存贮管理、查询检索、分析评价、输出表达等方面的要求。
为了解决这一问题,人们试图设计出能有效表达矢量和栅格两种数据的混合数据结构,曾提出了链编码(ChainCoding)、栅格、伪维矢量(pseudo-vector)等模型,它们在表示不同类型的空间数据(线、面和影像)时各有所长,但难以顾及各方面的要求。
因此,人们一方面继续探索新的混合数据结构,另一方面采用集成方法,在同一空间数据库管理系统中支持或管理矢量和栅格两种数据结构,允许数据库的每一目标采用适宜的矢量或栅格数据结构,通过“目标”实现统一的数据管理。
(2)主要适于描述和表达二维空间实体,难以有效地表达现实世界中的三维空间实体及其相互关系。
一般说来,利用这两种概念数据模型描述和表达三维空间实体(如城市建筑物)时,是将其投影到二维平面上去,将其第三维的信息作为属性处理,这在许多场合下导致空间目标划分与表达的困难。
(3)这两种概念数据模型侧重于空间点、线、面目标自身的描述,没有顾及到空间点、线、面目标之间的一些重要空间关系(如相交、穿越等)和空间实体之间从属、组合关系的描述与表达,因而在一定程度上不能有效地表达现实世界中的空间现象和支持空间分析。
(4)点、线、面数据模型和栅格数据模型最早是针对宏观(或小比例尺)应用发展起来的,因而在将其用于表达城市空间实体时,出现了一些新的问题。
例如,城市主要道路要用双线表示,因此原有线状目标的定义必须予以修正或扩充;再如,城市主要道路在小比例尺数据库中为单线目标,在大比例尺数据库中为双线目标,如何实现两者之间的有机联系,对于进行宏观与微观相结合的城市空间分析十分重要。
(5)从本质上说,前述的空间数据模型主要是表达某一时刻的空间实体及其相互之间的联系,没有考虑表示空间实体的时空变化,本质是上非时态的。
这种非时态GIS没有记录其历史状态和变化过程,因而难以回答诸如何时何地发生了什么变化、变化的类型和速率、变化的周期等问题。
实际上,人们要求GIS能够方便地提供空间实体分布和状态的最新信息,能够重构空间变化(或演进)的过程,预测和模拟未来的空间分布和状态。
(6)在点、线、面数据模型中,点、线、面空间目标之间的相邻关系是隐含的,在寻找某一空间目标周围的其它一些空间目标时往往要花费较长的检索与处理时间,这在一定程度上影响了其在空间现象动态分析和空间过程动态模拟中的应用。
(7)前面关于空间数据模型的讨论仅限于对集中式空间数据组织与管理的考虑。
如果一些相关联的空间数据库分布在不同地域上,或用户分散在一定的地域范围内,往往需要给用户一个总的、聚合的、唯一的空间数据集合及其统一管理办法,实现分布式空间数据管理。
在一些情况下,这些相关联的空间数据库可能是非均质的,如是基于不同的数据模型或设计方法,这就要求将诸多数据库模式集成起来。
针对这些问题,提出了一种空间数据模型:
时空数据模型。
侧重时空对象描述及其时空关系的时空数据模型以时空对象描述为主体,以面向对象技术为基础,模拟和描述现实世界地理空间的复杂对象,克服了传统地理数据模型的局限性,改进和提高了系统的性能。
虽然面向对象技术在建模概念、理论基础和实现技术上还没有达成共识,不够成熟,但它以更自然的方式对复杂的时空实体和现象模型化,是支持时空复杂对象建模的最有效手段。
该类模型的核心思想,以描述时空对象为主体和时空关系为目的,是以面向对象的基本思想来描述和组织地理时空现象,将时间、空间及属性在每个时空对象中置于同等重要的地位;其中对象是独立封装的具有惟一标识的概念实体;每个地理时空对象中封装了对象的时态性、空间特性、属性特性和相关的行为操作及与其他对象的关系。
(a)时空ER概念模型(Source:
NectaricaT和Christian)
Worboys较早总结和提出一个实用的面向对象时空数据模型(ST-objects),他认为世界是由众多的分离的单体构成,这些单体可以是整合了时间及二维空间的个体。
随后,由于面向对象的构模,能表达丰富的语义、能描述复杂对象的功能以及有很强的数据抽象能力等优点,吸引了大量的研究人员和学者,将研究的兴趣放在利用面向对象技术进行时空数据模型的建立上。
(b)宗地与Risk区之间关系MADS模型表达(Source:
Parent)
注:
(Nectarica和Christian提出一种时空ER概念模型,如图(a)所示,它能很好描述复杂时空对象的空间和时间语义及其关系。
MADS模型[Parent.Etal2006]是一种面向对象关系的概念模型,整合了时间和空间概念,但它没有涉及变化过程的描述,如图(b)所示。
国内研究人员或学者,更多的是从面向对象的时空逻辑模型作了一定的扩展和实践工作:
如张山山提出了时空对象扩展模型,为时空应用概念设计提供了有力的。
)
(c)时空对象扩展模型(Source:
张山山)
侧重时空对象及其关系描述的时空数据模型采用面向对象的思想,语义表达和建模能力都得到了很大的加强。
面向对象的时空数据模型利用OOP技术,将目标抽象为对象(空间对象和地理对象)的同时,将时间维引入到对象,连同对象的属性和操作进行封装,这样有利于打破传统关系模型范式的限制,直接支持对象的嵌套和变长记录。
2.2.2逻辑数据模型
2.2.2.1层次数据模型
一、层次模型的定义
层次模型是数据处理中发展较早,技术上也比较成熟的一种数据模型[5]。
它的特点是将数据组织成有向有序的树结构。
层次模型由处于不同层次的各个结点组成。
除根结点外,其余各结点有且仅有一个上层结点作为其“双亲”,而位于其下的较低一层的若干各结点作为其“子女”。
结构中结点代表数据记录,连线描述位于不同结点数据间的从属关系(限定为一对多的关系)。
对于图1所示的地图用层次模型表示为图2所示的层次结构。
图1原始地图
图2层次数据模型
层次模型反映了现实世界中实体间的层次关系,层次结构是众多空间对象的自然表达形式,并在一定程度上支持数据的重构。
但其应用时存在以下问题:
(1)由于层次结构的严格限制,对任何对象的查询必须始于其所在层次结构的根,使得层次对象的处理效率较低,并难以进行反向查询。
数据的更新涉及许多指针,插入和删除操作也比较复杂。
母结点的删除意味着其下属所有子结点均被删除,必须慎用删除操作。
(2)层次命令具有过程式性质,它要求用户了解数据的物理结构,并在数据操纵命令中显式地给出存取途径。
(3)模拟多对多联系时导致物理存储上的冗余。
(4)数据独立性较差。
二、层次模型的编码设计
代码是一个或一组有序的易于计算机或人识别与处理的符号,用来为数据分类提供一种缩写的结构,作为数据的唯一标识[6]。
对于层次数据编码可采用层次码,即按分类对象的从属、层次关系为排列顺序的一种代码。
把代码分成若干组,码中的值和位都代表一定意义,即将代码分成一定若干属级,并与分类对象的分类层次相对应,代码左端为高位层级代码,右端为低位层级代码,每个层级代码可采用顺序码。
对层次码的具体组织方式可划分为两种:
集中组织方式和分层组织方式,不同的组织方式对应不同的关系数据库。
(1)集中组织方式
以数据在每一层中的编码拼接作为关键字组织关系数据库。
其关键字的长度是各个层次上编码的长度之和,各个记录的关键字长度相等,上层关键字长度不足部分补“0”。
在图1中,假设第一层编码长度为3位且用数字编码,第二层和第三层的编码长度为1位且用字母编码,第四层编码长度为2位且用数字编码,则根结点的编码为XYZ0000(其中X、Y、Z各表示一位数字,这里假设分别为0、2、l),第二层结点的编码分别为02lA0O0、021B000、……,第三层结点的编码分别为021从00、OZIABoo、……,第四层结点的代码分别为021AA01、021从02、……,相应的关系数据库模式为:
模式名(编码,名称,……)。
这种组织方法可通过编码的前缀看出其层次关系,其代码结构相对比较简单,适于机器的统计汇总。
但由于不同层次的数据没有明显的区别,对有些操作的使用带来不便。
例如,在显示操作中,仅能显示出当前结点的名称(存储的科目名称),无法说明其所在的单位等信息,若在科目名称中增加单位名称,又会增加数据冗余。
另外,对于一个实际的企事业单位而言,库中的记录往往成千上万之多,占用存储空间较大,这不便于访问该数据库中的记录,因此为提高访问(查询)速度,必须建立索引或设置过滤器。
(2)分层组织方式
按照分层组织方法设计的各个关系数据库,其候选关键字是唯一的,均符合3NLF范式,因此在访问中间结点时,与下级结点无关,可以直接在上层数据库中进行操作,在访问明细科目时,与中间结点不发生关系,可直接对下层数据库操作,这样可加快访问(查询)速度,对数据库之间的操作可以通过关系运算实现。
例如,要详细显示与当前结点有关的各种数据信息,可通过数据库的关联操作在各个数据库之间建立关联,这样可方便地显示与当前结点相关联的上层或卜层数据库中的科目名称。
2.2.2.2网络数据模型
网络数据模型是数据模型的另一种重要结构,它反映着现实世界中实体间更为复杂的联系,其基本特征是,结点数据间没有明确的从属关系,一个结点可与其他多个结点建立联系。
如图5所示的四个城市的交通联系,不仅是双向的而且是多对多的。
如图6所示,学生甲、乙、丙、丁选修课程,其中的联系也属于网络模型[7]。
网络模型用连接指令或指针来确定数据阿的显式连接关系,是具有多对多类型的数据组织方式。
网络模型将数据组织成有向结构,结构中结点代表数据记录,连线描述不同结点数据间的关系。
网络模型的优点是可以描述现实生活中极为常见的多对多的关系,其数据存储效率高于层次模型,但其结构的复杂性限制了它再空间数据库中的应用。
网络模型在一定程度上支持数据的重构,具有一定的数据独立性和共享特性,并且运行效率较高。
但它应用时存在以下问题:
(1)网状结构的复杂,增加了用户查询和定位的困难。
它要求用户熟悉数
据的逻辑结构,知道自身所处的位置。
(2)网状数据操作命令具有过程式性质。
(3)不直接支持对于层次结构的表达。
2.2.2.3关系数据模型
一、关系模型的定义
在层次与网络模型中,实体间的联系主要是通过指针来实现的,即把有联系的实体用指针连接起来,而关系模型则采用完全不同的方法。
关系模型[5]是根据数学概念建立的,它把数据的逻辑结构归结为满足一定条件的二维表形式。
此外,实体本身的信息以及实体之间的联系均表现为二维表,这种表就称为关系。
一个实体由若干个关系组成,而关系表的集合就构成关系模型。
关系模型不是人为地设置指针,而是由数据本身自然地建立它们之间地联系,并且用关系代数和关系运算来操纵数据,这就是关系模型的本质。
M
I
II
I
a
b
c
d
II
c
e
f
g
I
a
1
2
I
b
2
3
I
c
3
4
I
d
4
1
II
e
3
5
II
f
5
6
II
g
6
4
地图:
多边形:
线:
关系数据模型是应用最广泛的一种数据模型,它具有以下优点:
(1)能够以简单、灵活的方式表达现实世界中各种实体及其相互间关系,使用与维护也很方便。
关系模型通过规范化的关系为用户提供一种简单的用户逻辑结构。
所谓规范化,实质上就是使概念单一化,一个关系只描述一个概念,如果多于一个概念,就要将其分开来。
(2)关系模型具有严密的数学基础和操作代数基础—如关系代数、关系演算等,可将关系分开,或将两个关
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- GIS 空间 数据模型 结构 研究