论文人口GIS设计与实现方法研究.docx
- 文档编号:11587537
- 上传时间:2023-03-19
- 格式:DOCX
- 页数:16
- 大小:137.46KB
论文人口GIS设计与实现方法研究.docx
《论文人口GIS设计与实现方法研究.docx》由会员分享,可在线阅读,更多相关《论文人口GIS设计与实现方法研究.docx(16页珍藏版)》请在冰豆网上搜索。
论文人口GIS设计与实现方法研究
人口地理信息系统设计与方法实现研究
王峰
(长春师范学院城市与环境科学学院,吉林长春130032)
[摘要]本文探讨了人口地理信息系统建设过程中系统需求分析、系统建设目标、系统设计、系统实施、系统应用前景。
人口地理信息系统建设的着眼点应该放在应用上,把它作为综合信息系统的一个有机组成部分,从而提高我国人口普查数据的利用价值。
[关键词]人口地理信息系统;地理信息系统(GIS);人口普查;
一、引言
人口信息系统需要地理空间信息的支持。
实际人口是按地理空间分布的,所以确切的完整的人口信息应当具有地理分布属性。
历史上人口普查和人口信息管理,因技术条件所限,未能带有地理空间信息,在当时与经济和社会发展对人口信息需求之间的矛盾不明显,但是随着人口数量急剧增加、社会结构日益复杂和生活节奏不断加快,不带地理分布的人口信息已明显不能满足现代社会发展的需要。
因此人口统计信息必须加上空间分布信息才能成为与现代经济和社会发展水平相适应的完整的人口信息。
GIS需要有人口信息内容。
目前国内已建立的各种GIS,尽管已被用于各个专业领域,但缺乏准确的甚至有些根本没有人口信息内容。
然而,人们将来需要进一步利用GIS进行经济社会系统工程的分析和决策,若缺乏作为经济社会活动主体的人口信息,就不可能构成完整的GIS,也就不能充分发挥GIS作用。
人口GIS蕴藏巨大的应用潜力。
公安部门是人口GIS的第一用户,也是人口信息日常维护和更新强有力的支持者。
当人口GIS能分辨单元门牌号码,便可直接与户籍信息管理系统联通,通过日常人口变动信息登记便可更新人口GIS。
公安工作也可充分利用人口GIS中的人口空间分布与空间环境信息提高其管理水平,从而使我国的人口管理向科学化、现代化和规范化迈进。
此外,人口GIS可在国民生活水平研究与预测,城市社会效益分析,以及文教卫生,市政建设(如交通、水电气暖等),商业服务等经济与社会发展方面开拓许多新的应用领域。
二、系统需求分析
人口地理信息系统要完成的任务包括:
如何把人口普查数据准确可靠和地理数据相结合;如何快速进行数据查询和汇总;面对大量的人口普查数据如何进行科学的分析;如何形象直观地表现数据间的规律;如何直观并且有效地为政府和社会提供决策依据。
人口地理信息系统基本要求:
友好的界面,完善的查询功能,齐整的报表功能,良好的安全性能,规范的接口,齐全的开发文档。
人口地理信息系统的功能目标:
1、定量、定性、定位相结合地管理人口数据,为人口及企业管理工作提供新的手段。
在多维地理空间建立人口资料库,实现人口及企业资料的GIS管理。
2、利用空间统计和分析手段,加工、分析人口及企业数据,建立形式多样的专题统计图表,形象地描述数据。
3、能在网络上运行,并采用数据、文字、图表、地图等多种形式输出信息,便于各部门综合利用人口数据和人口资料,实现人口普查成果增值,为政府、企事业乃至个人提供信息咨询服务,为区域可持续发展提供决策依据。
4、提供不同的版本,满足不同层次对人口地理信息的需要。
5、建成开放式系统,便于各部门加载信息,开发应用系统。
三、系统建设目标
建设“人口地理信息系统”的直接目标是:
实现空间位置信息和人口统计信息的有机结合,以便更好地管理和利用人口信息,更好地服务社会的可持续发展提供决策依据。
具体目标有:
[1]利用计算机、互联网、GIS等先进技术,为第六次人口普查提供先进的实施手段:
为调查区域划分提供一套完整详细的地图,保证调查区域的不重不漏,为调查成果的准确性提供进一步的保障。
将人口调查信息与空间分布连接起来,实现人口信息的空间定位,使人口信息更具意义。
利用GIS空间分析能力,综合利用人口普查数据,实现人口普查信息资源的增值,为各级政府提供决策依据和决策支持,为企业提供高层次信息咨询服务。
利用互联网技术,实现人口信息的全社会服务,最大化实现信息的价值,同时实现我国人口政策的宣传。
[2]在录入人口普查数据的同时,利用该系统有效地处理、分析人口普查数据,解决数据处理的滞后问题;
[3]开辟我国GIS应用的新领域,为其它统计数据的充分利用开辟一条成功的道路,为实现统计数据向信息的全面转化打下良好的基础。
四、系统总体设计
(一)系统总体结构框架
依据上一章提出的人口地理信息系统建设目标,我们提出人口地理信息系统的三层结构模式,即以第五次人口普查数据、历史人口普查数据、空间数据、工业调查数据、公共服务设施数据等为基础数据层,以人口地理信息数据库和基于人口信息服务的数据仓库为数据管理层,以地理信息系统平台为系统分析应用层。
图1为系统总体结构框架示意图。
上图所示的系统三层结构中,数据层指明了数据的来源,管理层指明了数据的组织管理模式,应用层则说明了系统的功能划分。
数据管理层包括人口地理信息系统数据库及其管理系统、人口数据仓库及其管理系统;分析应用层包括基于地理信息系统平台的人口地理信息综合服务子系统、人口统计业务子系统、基于人口地理信息的决策支持子系统、人口信息网上发布子系统四个组成部分。
(二)系统功能设计
针对人口地理信息系统的特点,我们采用以地理信息系统为平台、按不同应用要求划分子系统的方式进行功能设计。
与图1所示的系统总体框架一致,人口地理信息系统的功能包括两部分:
数据管理功能和分析应用功能。
1数据管理功能
人口地理信息系统的数据管理功能包括人口地理信息数据库管理、人口数据仓库管理和元数据管理三个部分。
(1)人口地理信息数据库管理功能
人口地理信息数据库管理通过数据库管理系统进行,为数据库访问提供服务,同时维护所有数据必需的特性。
具体包括事务处理、并发控制、恢复管理、安全管理、编程接口、容错处理、存贮管理等内容。
目前,已有许多成熟的大型数据库系统(如Oracle、Sybase等)具有强大的数据库管理功能,我们要做的是如何选用适当的数据库管理工具实现人口及其相关数据有机结合和有效管理。
(2)人口数据仓库管理功能
数据仓库是面向主题的、集成的、稳定的、不同时间的数据集合,用以支持管理中的决策制定过程。
人口数据仓库的建立是将分散的、不利于访问的第五次人口普查数据、人口历史数据、城市空间数据、工业和公共服务设施等数据转换成集中、统一、随时可用的信息,从而可以集成不同形式的数据,并为数据分析产品提供系统开放性。
(3)元数据管理功能
元数据定义为“关于数据的数据”,事实上,它是与数据仓库紧密结合的一个概念。
元数据帮助用户更好地理解、获取据仓库中的数据,也可以帮助数据仓库管理员更好地管理数据。
元数据大致分为四类:
关于数据仓库潜在数据来源的信息;关于数据模型的信息;业务数据与数据仓库数据结构间的映射;数据仓库中数据的使用情况。
2分析应用功能
系统分析应用功能以地理信息系统软件为平台,按不同的应用要求划分为四个部分:
人口地理信息综合服务功能、人口统计业务支持功能、基于人口地理信息的决策支持功能、人口信息网上发布功能。
(1)人口地理信息综合服务功能
人口地理信息综合服务功能这里指基于人口、地理等城市综合信息的GIS应用功能,例如人口分布和空间数据的显示和管理、人口和地形信息查询检索、基本的空间分析、查询和分析结果的输出等等。
这部分技术比较成熟,关键要体现人口的特点开发方便、实用的功能。
(2)支持人口统计业务
从人口统计业务的角度看,人口地理信息系统担负着为第六次人口普查实施、人口普查数据的分析处理、人口信息服务提供先进的手段。
本部分针对人口普查的实施、数据处理、信息服务等具体的统计业务开发相应的功能模块,提高业务处理效率和质量。
(3)基于人口信息的决策支持功能
人口信息对于城市的管理和发展有着十分重要的意义。
将人口信息和其它信息结合起来进行综合分析,能够为不同的应用领域提供辅助决策支持。
本系统以人口数据仓库为基础,综合应用联机分析处理、数据挖掘和空间分析技术开发基于人口信息的决策支持系统,实现人口数据的增值服务。
(4)人口信息网上发布功能
互联网的飞速发展正深深地影响着人们的生活方式,通过网络进行查询、下载、订购已逐渐成为人们获取信息的重要手段。
人口信息的网上发布,不仅能够很好地宣传人口政策,还能为市民和个企事业单位提供有关的人口信息以及其它信息。
根据目前的应用情况,我们建议采用地图网站的形式实现信息发布。
以上各个功能子系统不是完全独立,它们相互协作、相互联系,构成人口地理信息系统统一的功能体系。
(三)系统总体结构
人口地理信息系统所有的功能都将使用共同的数据库,而且大部分的数据都可以用地理数据这一连接纽带进行数据的交互引用和查询分析。
见图3.人口地理信息系统总体结构
(四)系统数据结构
系统数据从数据的总体形式上可分为空间数据和属性数据两大类,空间数据包括所有的具有地理特征的数据,属性数据则为普通的能以关系数据库记录表达的数据。
数据结构的存储方式划分大部分与空间数据有关,传统方式如模型一,采用文件服务管理空间数据,属性数据以RDBMS(关系数据库管理系统)存储,两者之间建立逻辑连接实现统一,这种方式把所有的数据分析工作放在GIS系统里,需要专家级的GIS平台,工作站的硬件及软件要求较高;模型二则采用RDBMS与空间数据库服务器中间件SDE(空间数据库引擎)配合,把空间数据存储到RDBMS中,数据分析工作由SDE配合RDBMS完成;模型三则采用R/ODBMS(关系/对象型数据库管理系统)直接实现数据管理的统一,数据分析工作由R/ODBMS一次完成,该方式对GIS系统的要求较低。
人口地理信息系统的功能模块分为两大类,一类是与GIS平台有关的系统,必须采用GIS系统作为运行环境,并进行二次开发建立系统,由GIS建立数据连接;另一类则采用标准的系统开发方式,直接与RDBMS或R/ODBMS进行数据交互。
(五)软硬件配置
1.操作系统、数据库平台
对于客户端,选用Windows98/NT/2000/XP操作系统;对于服务器,使用WindowsNT作为服务器端操作系统。
数据库平台选用Oracle8i。
2.GIS平台选择
当前国际上主流GIS平台软件主要有Arc/Info、MGE、MapInfo、AutoCADMap等,国内近年来也推出了国产GIS平台软件,如GeoStar、MapGIS等。
GIS系统的选择需要从数据的制作、数据分析及综合应用、WEB信息发布几个方面考虑。
可供选择的方案有:
ESRI系列、Autodesk系列、Intergraph系列等。
3.后台数据库管理系统
考虑到人口地理信息系统包括大量的图形信息和人口统计信息,建议采用大型数据库。
在高性能数据库Oracle、Informix、Ingres和Sybase中,Oracle对各种GIS软件平台和空间数据以及Internet都有很好的支持,是首选的数据库。
4.系统开发工具
在以上操作系统、数据库管理系统、GIS系统的基础之上,需要开发一些功能模块。
开发的工具可用VisualC++、VisualBasic等
5.系统硬件
采用Client/Server结构。
客户端选用IntelPC系列;服务器采用专业服务器,保证基本配置为内存512M以上,大容量、高速硬盘,CPU主频PentiumII400M以上的单(多)处理器系统。
五、系统实施策略
本章围绕系统总体结构框架,阐述人口地理信息系统的实施策略。
考虑到系统实施的逻辑顺序和关键技术,本章将从以下几个方面进行系统的阐述:
系统数据的选择、数据的组织与管理、建立人口数据仓库、关键技术和主要算法、人口信息网上发布。
(一)系统数据的选择
数据是信息系统的基础,而建立功能强大的信息系统更要选择和组织广泛、结构合理的系统数据。
人口地理信息系统与其它信息系统相比具有自身的特点,人口数据的应用十分广泛,且往往与其它社会统计、经济等数据结合,实现数据的增值。
人口地理信息系统的数据基础,主要包括五次人口普查数据、空间数据、适当详细程度的人口历史数据(历次人口普查、人口抽样数据等)、工业布局及其它相关数据。
空间数据主要包括各种比例尺地形纸图、栅格地形图和矢量地形图;还包括各种分辨率的航空遥感影像图和卫星遥感影像图。
其它相关数据:
结合人口地理信息系统的特点,系统数据还包括普查小区、门牌、居委会、街道等的划分信息,还包括工业区、科技园、商业区等内容。
这些数据将在进一步的用户调查过程中进行不断的补充。
(二)数据的组织与管理
如何实现系统数据的有序组织和高效管理,是建立人口地理信息系统的关键所在。
本节将主要讨论这方面的解决策略。
这部分的主要内容包括:
数据关联策略、数据更新机制、人口数据库建立方法。
1.数据关联策略
从前面关于系统数据选择的阐述可以看出,人口地理信息系统涉及的数据内容十分庞杂,只有将这些数据有序、高效地管理起来才可能建立一流的信息系统。
而数据关联是实现数据有机结合、形成统一整体的有效途径。
实现数据的有效关联,应主要进行以下几方面的工作。
(1)建立统一的地理框架。
地形图采用的是坐标系,将人口普查数据、公共服务设施数据、工业调查数据等也纳入到这一坐标系中。
大致包括下列方面:
Ø按普查(第五次)采用的区域划分标准(行政区、普查小区),在地形图上获得一系列的范围坐标并数字化;
Ø通过地图标绘、实地判读等手段,获得工业地理数据(如厂区范围、中心坐标);
Ø将有关历史数据进行某种程度的综合,确定合理范围(数据的详细程度),如人口历史数据可以综合到街道、工业数据详细到工业区等;
(2)进行统一的地理编码(Geocoding)。
2.数据更新机制
对于信息系统而言,数据更新能力的重要性是不言而喻的。
针对人口地理信息系统涉及的不同数据内容,我们采用多种层次的数据更新方式。
数据的更新可以先制定一个比较灵活的机制,而在实践中进行不断的调整,不断完善数据的更新模式。
(1)城市空间数据的更新
城市的建设和发展日新月异,城市地形的变化每天都在进行,我们既要不断更新这些数据,又不可能时时更新。
我们提出适时更新的办法:
即,根据不同空间数据(对应电子地图的不同图层)与人口等数据分析和应用的密切程度,来确定适当的数据更新优先顺序和更新频率。
如住宅区的兴建和拆迁和人口等信息密切相关,应该及时更新;而水系等要素可能和人口关系不是特别密切,则可以按一年、两年更新一次,或先更新城市局部。
(2)人口普查数据的补充
全国人口普查每十年进行一次,普查数据对城市的管理和发展有着重要的作用,但在应用中必须结合统计局定期的人口抽查、计生部门的统计、公安部门的户口和流动人口登记等业务进行数据补充。
当然,补充的这些数据也必须参照以上的策略进行适当的编码,实现和空间数据和其它城市数据的关联。
(3)工业及其它相关数据的更新和补充
统计局每年都要进行比较详细的工业调查,这为城市工业数据的更新提供了有力的保障。
其它相关数据如公共服务设施等也要按照一定的更新规则进行更新和补充。
同样,在更新、补充时要进行适当的编码和关联。
3.数据统计和分析
数据统计内容包括:
每户的人均居住面积;工作者的受教育程度;妇女受教育程度;死亡人口;城市集体户;暂住人口;常住人口。
数据分析:
空间分析解决方案
主要从GIS的空间分析的角度出发来考虑。
包括:
叠加区分析,缓冲区分析,趋势面分析(用三次多项式来拟合),泰森多边形,最短路径分析。
建议将现有的大多数非统计业务都放在这个里面。
统计分析解决方案
在自然科学和社会科学的许多学科中,统计分析作为一种数据处理方法占有很重要的地位。
特别是随着计算机技术的发展,传统的数理概率统计理论在国民经济发展中应用的范围越来越广泛。
人口分析技术是进行人口问题研究的重要工具和手段,尤其是基于多元统计理论的人口问题分析,近年来的发展更是突飞猛进。
因此,在人口统计分析模块解决方案中,我们应该以多元统计分析为主、模型分析为辅,对人口数据进行分析研究。
其采取的主要方法有:
.回归分析:
一元线性回归,一元非线性回归,多元线性回归,逐步回归
.相关分析:
普通相关分析,典型相关分析
.因子分析:
按现有的思路来
.判别分析:
距离判别分析,Bayes判别分析,Fisher判别分析,逐步判别分析
.聚类分析:
层次聚类分析,动态聚类有序样本聚类,模糊聚类
.对应分析:
二元对应分析,多元对应分析
4.人口地理数据库的建立
以上谈到的系统数据的选择、数据关联策略和数据更新机制都是建立人口地理信息数据库的内容。
这里主要讨论人口地理数据集合的合理存放。
一般来说,数据库的集合存放有这样几个要求:
最小冗余度原则,即数据尽可能不重复;应用程序对数据资源的共享原则;数据独立性原则,即数据的存放尽可能地独立于使用它的应用程序;统一管理原则。
数据库的设计方法,随数据库的类型、大小、复杂程度和使用时间的长短等因素的不同而不同。
只要能将所有的数据有效、合理地存贮在数据库中,并能满足用户的要求,无论怎样的设计方法都可以。
数据库设计过程中通常的步骤和思路包括:
需求分析、原型概念化设计、数据库详细设计、试点项目实施和数据库总体实施。
(1)用户需求分析
用户需求分析,即明确了解系统的用户对数据库内容和行为的期望和要求。
在这一过程中,主要了解:
即将开发的GIS所支持的各种功能;系统要求的数据内容和行为;数据之间的关系和优先次序;数据库和GIS的整体要求和蓝图。
需求分析的过程实际上是一个继承与发展的过程。
“继承”要求全面调查、了解基本情况,是一个学习和认识的过程;而“发展”是一个改革和创新的过程,以分析和创造为主。
人口地理信息系统在我国是一个新的研究和应用领域,针对综合数据的有机结合、分析处理、应用等方面还需进行深入调查、分析、创新。
(2)概念化设计
数据库概念化设计是从抽象的角度来设计数据库,包括:
数据库的宏观地理定义(比例尺、地图投影和坐标系统的定义);数据库的地理特征设计(地理特征的几何表达形式);数据库表格及其关系的设计表达(与地理特征有关的属性数据的表达方式);数据库总体设计的评定。
人口地理数据库要建成一个开放的数据库,目前主要包括地理数据库、人口普查数据库、工业普查数据库和公共服务设施数据库。
各个数据库之间既要保持相对的独立性(存贮、应用等方面),又要实现有机的联系(逻辑联系、综合应用等)。
上面提出的增加地理数据图层——地理编码——拓扑关联的方法能够同时兼顾多种数据之间的独立性和有机联系。
(3)数据库详细设计
人口地理信息数据库的详细设计可以分为五个方面的内容:
数据源的选择;各种数据集的评价、各数据集的设计;元数据的产生;数据库具体存储和管理结构的设计。
各数据层在数据库中的组织和其各相关表格的设计,是将整个概念化设计转化成最终的详细设计的过程。
这一过程主要包括三个方面:
属性数据类型的设计;编码标准的设计;各表格中主关键项的选择。
元数据是对于整个地理信息数据库的总结和详细的小结,可把它视为数据库的蓝图,可以帮助用户理解整个数据库的组织和内容以便更好地使用数据库。
元数据通常包括:
数据库的总体组织结构;数据库总体设计的框架;各数据层的详细内容定义及结构;数据命名的定义;元数据内容等。
其中数据总统设计的框架部分主要包括:
数据来源、整体命名方法、各特征的最大最小范围、有效值、地图投影、图幅匹配及精度、线与多边形的拓扑关系及连续性、封闭性、质量控制的过程和内容、数据的各种文件和表格等。
数据库的存储管理结构,需要考虑数据精度、数据库管理软件选择、数据库的管理等方面。
本项目选用数据库管理软件Oracle8i管理人口地理数据,数据库的管理的主要内容有:
数据使用权限的设置;数据库更新过程中的质量控制和安全性考虑;数据库的恢复能力;合理管理单元的设定;数据库系统的网络考虑等。
(三)建立人口数据仓库
数据仓库概念提出的意义主要在于建立一种数据存储体系结构,把分散的、不利于访问的数据转换成集中、统一、随时可用的信息,从而可以集成不同形式的数据,并为数据分析产品提供系统开放性。
数据仓库为不同来源的数据提供一致的数据视图,一经与数据挖掘、联机分析处理等数据分析方法相结合,能使数据得到更充分的利用。
决策支持系统为了更有效地实现对决策过程的支持,需要掌握充分的信息,从而经常需要访问大量的、不同数据源的、当前或历史的数据,即使得到所需的数据,还需要对其中具体的、细节的数据进行综合、总结、概括。
而这些正符合数据仓库内数据的特点。
建立以数据仓库为核心的综合决策支持系统,将决策支持系统技术与数据仓库技术有机地结合在一起,必将会更大限度地发挥对决策的支持作用。
人口数据仓库以城市综合数据库为源数据库,按一定的规则进行数据抽取、清洗、聚集和转换后入数据仓库。
元数据按一定的标准和分类规则对数据仓库中的数据进行全面描述,支持数据的有效管理、开发和应用。
联机分析处理和数据挖掘技术将结合空间分析、统计分析等方法作为决策支持模块的数据处理和分析工具(这部分内容将在决策支持系统研发过程中进行深入研究)。
图4.为数据仓库系统的结构框架。
数据仓库的设计将采用面向主题的自顶向下的设计方法。
设计过程同传统数据库设计一样经历概念模型设计、逻辑模型设计和物理模型设计三个阶段,对于面向主题的数据仓库,分别对应数据仓库中的信息包图设计、星形图模型设计和物理数据模型设计。
(四)系统功能实现
1.人口地理模型初步设计
一般模型有三类功能:
第一类查询功能(两种查询方式:
C/S方式、B/S方式)固定查询,条件查询。
第二类统计计算功能:
数据表输入;根据输入数据计算所需指标;简单的编程。
第三类系统维护管理:
地图库维护、更新;数据库维护、更新。
模型设计与实例:
供查询的主要指标
指标名称
人口普查数据来源
计算公式
地理范围
(1)人口构成
总人口性别构成
男(女)性人口总数
男(女)性比重=-------------------
人口总数
计算公式:
总人口年龄构成
计算公式:
列分组表和各特殊意义分组表,画出年龄金字塔图(分组年龄段待定)
人口的文化教育程度构成
计算公式:
人数比重
分组:
研究生
本科
大专
未上过学
6周岁以下儿童
(2)人口分布密度
总人口分布密度
某地理范围内总人口数
总人口数分布密度=───────────
该地理范围土地面积
计算公式:
户籍人口分布密度:
同上
现存人口分布密度:
同上
外来人口分布密度:
同上
(3)出生率和死亡率
数据来源:
已计算出的出生人数和平均人口数
出生人数
出生率=──────╳1000‰
平均人口数
计算公式:
死亡率
数据来源:
已计算出的死亡人数和平均人口数
死亡人数
死亡率=──────╳1000‰
平均人口数
计算公式:
自然增长率
计算公式:
自然增长率=出生率-死亡率
家庭状况:
家庭户数及占总户数比重
计算公式:
家庭户数
家庭户比重=──────
户数总计)
家庭户户均人数
人口数户均人数
───────---
户数(
计算公式:
(5)劳动力资源
劳动力资源数量
劳动力资源总数(按常住或现有人口计)
计算公式:
劳动力资源数量(按常住或现有人口计)=15周岁≤户籍人口数中年龄<60周岁的人口数
劳动力资源构成
实际有工作人数占劳动力资源数比重
实际有工作有工作人数
人数占劳动力=───────────
资源数比重有工作人数+未工作人数
计算公式:
劳动力资源分布密度
劳动力资源分布密度(按常住或者现有人口数计)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 论文 人口 GIS 设计 实现 方法 研究