计算机本科毕业论文一种基于XML的电子信息装备试验数据采集软件设计.docx
- 文档编号:30750479
- 上传时间:2023-08-20
- 格式:DOCX
- 页数:9
- 大小:483.14KB
计算机本科毕业论文一种基于XML的电子信息装备试验数据采集软件设计.docx
《计算机本科毕业论文一种基于XML的电子信息装备试验数据采集软件设计.docx》由会员分享,可在线阅读,更多相关《计算机本科毕业论文一种基于XML的电子信息装备试验数据采集软件设计.docx(9页珍藏版)》请在冰豆网上搜索。
计算机本科毕业论文一种基于XML的电子信息装备试验数据采集软件设计
计算机本科毕业论文:
一种基于XML的电子信息装备试验数据采集软件设计
摘 要:
针对电子信息装备试验数据的多样性和复杂性,提出了基于XML的数据采集方法,设计了雷达侦察距离试验的数据概念模型和图形概念模型,并生成了XMLSchema,研究了如何存储试验数据XML文件,最后设计并实现了数据采集软件。
关键词:
XML;数据采集;数据格式定义
1 引言
电子信息装备试验的复杂性导致每个试验产生的数据多种多样,即使是同一类型试验产生的数据也不尽相同。
如何用一个通用软件对各类试验的数据进行有效采集是实现数据采集自动化的关键,是影响数据采集质量的重要因素。
数据采集的质量对数据的处理和应用起着至关重要的作用,是影响数据作用发挥的重要因素之一。
试验数据采集软件应能够对各类试验数据进行有效采集,应具有可扩展性和自描述性,能够根据每个试验、每个试验题目自定义数据采集格式,自动生成数据采集表格。
XML具有可扩展性和自描述性,使其在数据交互和信息共享方面拥有天然的优势[1],采用XML格式来表示各类、存储试验数据和信息,实现试验数据自动采集与转换功能是试验数据采集软件的最佳选择。
2 基于XML的试验数据采集方法
2.1 试验数据的基本形式
数据是指原始的、未加工的单一信息实体的集合。
数据一般分为结构化数据和非结构化数据。
结构化数据是指经过分析和处理后的数据,并且组成数据的各个部分能够自我识别,以便于计算机和人对数据进行存储、查询和更改操作。
数据结构化能根据数据的内容、含义或用途不同而标志不同的数据。
非结构化数据是指试验过程中产生的大量的文档、图像等无法进行结构化解析和处理的数据。
2.2 试验数据概念模型
试验任务种类的多样性和复杂性导致了试验数据的多样性,即使同一类型试验由于被试设备的不同产生的数据也不一定相同,试验数据的采集与存储不是用一个概念模型能够确定的,而是需要根据每个试验任务的不同制定特定的数据概念模型。
尽管试验数据的概念模型不同,但是制定试验数据模型的方法、试验数据的分类等是一致的,因此本文选取一个雷达试验的侦察距离试验题目为例建立试验数据概念模型。
概念模型分为数据概念模型和图形概念模型两类。
(1)数据概念模型
雷达侦察距离试验数据有两部分:
产生试验数据的影响因素和获取的试验数据。
此处假设该试验题目是在无干扰条件下的侦察距离试验,被试设备是雷达,配试设备是精测雷达和机载GPS,抽象出以下雷达侦察距离试验题目的结构化数据信息。
(1)试验任务基本信息。
包括试验任务名称、试验任务代号、试验任务分类、下任务文件、试验性质、提任务单位、参试单位、总试验师、副总试验师、试验师、试验地点、试验开始时间、试验结束时间。
(2)动态试验题目基本信息。
包括试验题目、试验方法、试验态势描述、被试设备工作状态描述、配试设备工作状态及关系描述、环境描述、指挥调度情况、输出原始数据、关键点数据、试验结论。
(3)试验态势基本信息。
包括设备阵地布局、预设航迹。
(4)设备布局信息。
包括设备型号、设备起始点位、设备结束点位、机动开始时间、机动结束时间。
(5)预设航迹信息。
包括航迹编号、航迹起点、航迹终点、起点时间、终点时间等。
(6)气象环境信息。
包括时间、区域、气象特征描述、温度、气压、相对湿度、能见度、云高、云量、风速、风向。
(7)电磁环境信息。
包括监测区域、监测开始时间、监测结束时间、起始频率、终止频率、频谱数据、强度范围、频率范围、信号个数、信号方向、信号特征参数。
(8)指挥调度信息。
包括时间、指挥员、指挥内容。
(9)被试设备工作状态记录数据。
包括设备名称、数据产生时间、工作方式、发射功率、工作状态、信号样式、载频、重频、脉宽、天线(波束)扫描样式、天线(波束)扫描参数、极化方式、受干扰程度、抗干扰措施。
(10)被试设备输出数据。
包括设备名称、数据开始时间、数据结束时间、数据采样率、列定义、数据块。
(11)GPS输出数据。
包括挂载设备名称、数据开始时间、数据结束时间、数据采样率、列定义、数据块。
(12)精测雷达输出数据。
包括设备型号、数据开始时间、数据结束时间、数据采样率、列定义、数据块。
(13)关键点数据。
包括批号、时间、方位、俯仰、距离、速度、目标类型。
(14)试验结论。
包括设备型号、侦察距离。
根据数据的应用情况,在对设备原始数据进行应用时一般是对整个数据包进行应用,因此此处未对设备输出原始数据进行拆分,仅标注了数据定义的基本要素。
如果有对数据拆分的需求,则可以把数据拆分处理。
如可将GPS输出数据定义为:
挂载设备名称、数据开始时间、数据结束时间、经度、纬度、高度、速度、航向、坡度、时间等。
由于XML文件是按层次存储的结构化文件,因此上述定义中各数据要素之间可能存在层次关系。
以拆分后的GPS输出数据为例,经度、纬度、高度、速度、航向、坡度、时间等要素为其他要素的下一级。
(2)图形概念模型
把雷达试验侦察距离试验的主要概念绘制成节点,节点通过以椭圆包围主要概念来表示。
关系紧密的概念在模型中互相紧靠。
最后给图形添加基数约束,这些基数约束是领域必须的。
在靠近某个边和某个概念之间的连接处,标出约束基数,表示在这个简单的关系中对概念出现次数的约束。
图1给出雷达试验侦察距离试验题目数据的图形概念模型。
2.3 试验数据XML模型的生成
(1)XML模型的命名规则
试验数据的XML模型的命名规则应遵照相关标准执行,采用国标、国军标及单位相关标准规定的命名规则和名称。
一般地数据项名称应由一个或多个英文单词或英文缩写组成,应能表达数据项名称的含义,英文单词或英文缩写间无连接符,英文单词或英文缩写首字母大写。
也可采用标准的中文命名规则,中文名称应符合相关术语标准及数据元标准。
为更好的描述数据及之间的关系,本报告中相关命名是按照中文命名的,实际应用中是按照英文缩写方式进行命名的。
(2)试验数据XML文件组织模式在试验数据的XML模式中,选择用元素表示试验数据的内容,以提高数据的层次性和可扩展性。
下面的例子描述试验指挥调度信息,可以用下面的代码表示:
根据上述内容的规定和要求,用XMLSPY生成的雷达试验侦察距离试验题目数据的XMLSchema如图3所示[4~5]。
3 试验数据XML存储模型
3.1 XML存储方法概述
采用基于XML模式进行数据采集,采集后的试验数据存放到了XML文件中,如何对这些含有大量数据的XML文件进行存储是需要研究的内容。
选用合理的方法进行存储有助于提高数据的利用率。
当存储XML文档时需要考虑两个问题。
首先,以什么方式存储XML文档,存储是否方便;其次,如果以某种方式或其他形式对信息进行存储,是否能方便地查找这些信息。
关系数据库是存储产品数据XML文档的首选。
选择数据库存储XML文档最重要的因素是确定存储的是以数据为主的XML文档,还是以文本为主的XML文档[2]。
3.2 以数据为中心的XML文档
以数据为中心的文档是用XML来传输数据,设计XML文档的目的是供其他系统调用或对数据的直接使用。
因此,对应用程序或数据库来说,将这些数据长时间地以XML格式存储没有什么意义。
以数据为中心的XML文档可以从数据库中产生。
存储在关系数据库中的产品结构化数据就可以从数据库中直接产生XML文档。
3.3 以文本为中心的XML文档
以文本为中心的XML文档是供数据分析处理或应用程序使用的,例如以XML格式存储的试验原始数据、设备输出数据、图像数据等都是以文本为中心的XML文档。
以文本为中心的XML文档包含不规则结构大粒度(或粗粒度)数据,包含大量的混合内容,具有可辨别的有序结构,通常是由设备自动输出的数据。
3.4 以数据为中心与以文本为中心的XML文档存储
确定了XML文档是以数据为中心还是以文本为中心后,就可以决定存储数据库的选择,这里选择关系数据库存储试验数据。
在进行存储时,以数据为中心的XML文档通过拆分后转换为数据库的记录直接存储,以文本为中心的XML文档可将整个文档存储到关系数据库中。
在以数据为中心的XML文档的存储方法中,XML文档中每个结构被给定一个关系数据库中的唯一标识符。
每个元素、属性和字符数据分别作为单独的字段存储在数据库表中,这样可以被单独访问、修改或删除,而且几乎不影响其他文档结构。
这种方法提供了很大的灵活性。
虽然,当XML文档很大时,重组整个文档可能会花很长的时间,但现在很多商业DBMS都提供存储和生成XML文档的工具,因此,不需要过多地考虑XML文档重组方面的问题。
在以文本为中心的XML文档存储方法中,XML文件是作为一个字段存储到数据库中,数据库支持直接对XML文件的存储和访问,支持基于XML查询的SQL语句,用户通过DOM方式可读取文件内容。
4 采集软件设计与实现
4.1 软件总体设计
基于XML的数据采集软件是以处理以数据为中心和以文档为中心的试验数据为核心,通过对各类试验数据的转换、处理,实现试验数据的有效采集与存储。
能够根据每个试验任务的不同生成适合该试验任务的数据采集内容,能够对各类数据进行有效转换和标注,能够以XML文件的方式存储数据,能够将收集到的数据迁移到中心数据库中[3]。
从图4可以看出,该软件主要包括以下三个功能模块:
数据采集格式定义模块、数据转换与录入模块和数据迁移导出模块。
数据采集格式定义模块预定义了靶场常见类型试验的数据采集模版,根据每项试验任务的不同选取相应的模版,并能够根据任务实际对模版内容进行合理取舍,能够生成数据采集表格;数据转换与录入模块能够将试验过程中产生的各类电子表格、文件转换成XML文件,能够对试验数据进行录入并保存成XML文件;数据迁移与导出模块主要是将XML数据文件通过相应的转换规则导入到主数据库中。
对于以文本为中心的XML文件存成数据库中的一个字段,对于以数据为中心XML文件通过迁移功能导入到中心数据库中。
4.2 软件技术实现
试验数据采集软件的数据存储与平台无关,采用XML进行数据存储,中心数据库采用Oracle9i关系数据库作为试验数据存储平台,采用C#语言,基于XML的DOM技术实现数据采集模版定义、数据录入,以ADO.NET调用方式实现对数据的迁移。
在具体实现过程中充分采用C#中System.XML命名空间的特性,实现对XML节点操作、文件操作及文档内容操作。
System.Xml命名空间中主要包含的类及说明如表1所示。
根据System.Xml类的功能,定义了一个XML功能类,能够添加、删除、修改XML节点,合并XML文件,添加数据,导出数据采集表格。
由于XML文档是一种自描述性的半结构化文档,所有的信息都蕴含于文档本身,因此可从文档中抽取文档的结构、内容和属性信息。
采用上述定义的XML操作类可实现对文档的基本操作,包括结构读取、节点操作、内容操作和属性操作。
可采用DOM技术,对每个XML文件在内存中构造DOM树,从根节点开始,遍历每个节点。
与文本操作相关的节点为TEXT,结构信息主要体现在EL-EMENT元素节点中。
属性也属于一类节点,但不在DOM树中,而是隶属于具体每个元素节点,可单独进行提取。
5 结语
数据是试验的灵魂,获取数据是进行试验的根本目的。
本文研究了基于XML的数据采集方法,选取典型任务分析了如何基于XML文件进行数据采集。
试验数据采集是一项长期性工作,做好数据采集工作任务非常艰巨。
本文是对长期以来试验数据难以有效采集的问题进行了初步探讨,并设计了数据采集软件。
参考文献
[1]许峰,张雪洁,李凤生,等.XML数据集成平台的研究与应用[J].计算机工程与设计,2009,30(13):
3212~3215
[2]殷丽凤,郝忠孝.不完全信息环境下存在XML强多值依赖的XML文档规范化研究[J].计算机研究与发展,2009,46(7):
1226~1233
[3]刘智瑁,彭媛.XML的生物信息数据的存储与实现[J].电脑编程技巧与维护,2009,11:
67~68
[4]王易,桂浩.合成模式在XMLSchema设计中的应用[J].计算机与数字工程,2009,37(8):
157~160
[5]南松辉,田佳,张海波,等.基于UML和XMLSchema的航天飞行数据建模[J].兵工自动化,2008,27
(1):
46~48
[6]徐享忠,王精业,蒋海滨.基于XML的数据交换格式及其应用[J].计算机工程与设计,2003,24(5):
77~80
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机 本科毕业 论文 一种 基于 XML 电子信息 装备 试验 数据 采集 软件设计