本科毕业设计基于XML的知识管理系统.docx
- 文档编号:9586424
- 上传时间:2023-02-05
- 格式:DOCX
- 页数:96
- 大小:402.83KB
本科毕业设计基于XML的知识管理系统.docx
《本科毕业设计基于XML的知识管理系统.docx》由会员分享,可在线阅读,更多相关《本科毕业设计基于XML的知识管理系统.docx(96页珍藏版)》请在冰豆网上搜索。
本科毕业设计基于XML的知识管理系统
摘要
在知识工程中,知识表示的重要性是不言而喻的,它的质量直接影响着运行着它的系统的性能。
本文进行了对基于扩展标识性语言―XML的知识表示方法的研究工作。
和HTML一样,XML也是互联网络上的通用描述性语言,但是它却比HTML有更多的优点,因此也就成为互联网络上研究的热点。
本文就是XML的一个应用,在知识工程领域用XML来对知识进行表示,并将其应用到企业知识管理当中。
通过XML来表达知识、传递知识,不仅跨越了平台(XML具有天然的与平台无关性),还跨越了空间(Internet的范围扩展到无线),更跨越了设备(XML的数据与表现的分离可以成为不同的终端间交换信息的载体)。
因此基于XML的知识表示方法在互联网络上有着传统的知识表示方法所无法相比的优势,而应用到企业的知识管理当中,帮助企业的经营管理转向知识管理,将对企业的效率提高有相当大的作用。
因此在本文中,首先讨论了基于XML的知识结构化表示的BNF范式,并将基于XML知识表示用到了一个企业的知识管理框架当中。
将XML描述的结构化知识和XML描述的企业知识管理框架结合起来,对企业中相关的主要元素对象进行了提取,构建了相应的文档类型定义―DTD。
根据DTD,构建了完整的XML文档,保证了其结构的完整性;利用微软浏览器内置的解析器对其进行解析,保证了其合法性。
然后,利用文档对象模型―DOM分析研究了DOMTest系统,利用DTD提供的处理XML文档的API接口和微软提供的方法构建了一个类模块,基于这个类模块对已构建的XML文档进行处理,以满足不同的需要。
最后,介绍了基于XML知识管理系统EKnowledge的体系结构和工作原理。
关键词:
XML;知识表示;知识管理;文档对象模型;知识管理系统
Abstract
ItiswellknownthatKnowledgeRepresentationisimportantforKnowledgeEngineering;itsqualityimpactsdirectlythesystem,whichrunit.ThispaperresearchestheKnowledgeRepresentationmethodbasedonXML(eXtensibleMarkupLanguage).AsthesameasHTML,XMLisalsothegenerallydescriptivelanguageonInternet.YetXMLhasmoreadvantagesthanHTML,whichmakesmanyresearchworksfocusonit.
ThepaperisanXML-basedapplication,whichisanXML-basedKnowledgeRepresentationmethodinKnowledgeEngineeringandisappliedtoenterpriseKnowledgeManagement.ItisadvantageoustorepresentknowledgeandtotransmitknowledgebyuseofXML,whichspansplatform,spansspace,evenspansdevice.Comparedtotraditionalrepresentationmethod,theXML-basedknowledgerepresentedcanbeeasiertorepresentandtransmitonInternet.EspeciallywhenitisappliedtoenterpriseKnowledgeManagement,theenterpriseefficiencywillbeprovedrapidly.
Sointhispaper,firstly,asetofBNFonXML-basedKnowledgeRepresentationprovided.TheXML-basedknowledgeandXML-basedKnowledgeManagementframearecombined;themainelementobjectsareextractedinordertoconstructDTDsrelatedwithobjects.AccordingtoDTDs,acompleteXMLdocumentconstructed.TheparserinMicrosoftIE5.0makestheXMLdocumentlegal.Secondly,DOMTestsystemdesignedbyuseofDOM(DocumentObjectModel),AclassmoduleconstructedthroughtheAPIinterfaceprovidedbyDOMandthemethodsprovidedbyMicrosoft.TheclassmodulecanprocesstheXMLdocumentconstructedabove,whichmakesdifferentneedspossible.
AttheendthispaperintroducesthestructureandworkingprincipleofXML-basedknowledgemanagementsystemEKnowledge.
KeyWords:
XML;KnowledgeRepresentation;KnowledgeManagement;DOM;KnowledgeManagementSystem
第一章绪论
1.1论文研究的目的和意义
随着计算机的应用深入到基于知识处理的人类智能的活动领域,以及较有代表性的一些专家系统的产生,E.Feigenbaum在1977年首先提出了“知识工程”(KnowledgeEngineering)这一概念,使之成为一崭新的研究领域,在八十年代获得了很大的发展[1].知识工程目前己成为国际计算机界的热门研究方向[2]。
在知识工程中,知识表示的重要性是不言而喻的,它的质量直接影响着运行着它的系统的质量。
正因为这样,知识表示的研究是人工智能的热门论文。
人工智能对知识的强调导致了以专家系统(ExpertSystem)为代表的知识工程的兴起,这也导致了知识表示的发展,进而导致了在企业当中从传统的企业管理向着知识管理的方向迈进,如何更有效的利用知识成为目前在企业的经营运作过程中的焦点。
目前知识表示不仅成为人工智能的重要分支,而且成为了一个独立的子领域。
对于知识的表示方法有很多,本论文的研究是基于“可扩展标记语言”—XML(ExtensibleMarkupLanguage)的知识表示方法,并设计了基于XML的知识管理框架,将基于XML的知识表示方法应用到企业知识管理当中,取得了很好的效果。
1.2传统知识表示方法研究
所谓“专家系统”,就是在计算机内依据专家的经验建立的基于知识的系统,系统中储存有能够使之在专家的水平上进行问题求解的专门知识,这个系统能提供智能的建议或对处理的问题做出智能的决策[3]。
专家系统求解问题的能力之所以能在一定范围内达到或超过人类专家的水平,主要原因在于它的知识库中包含有专家的专门知识。
专家系统作为一架知识处理机,其解决问题的能力和质量直接取决于知识的数量和质量。
那么,如何对知识进行处理,如何获取和表示知识,以便能被计算机系统最好地利用是专家系统(ES)和知识工程(KE)中的关键问题[2].
1.2.1知识及知识表示的概念
一般来说,知识是由特定领域的描述关系和过程组织的。
对任何知识而言,一般都可采用F.Hayes--Roth提出的知识的三维空间来描述。
即知识的范围、知识的目的和知识的有效性(validity)[2]。
图1-l给出了知识的三维空间的描述。
知识包含规则、事实和过程。
规则表示对象间的关系,事实表示对象特征,过程表示对象间的一种代数运算。
知识表示的方法对领域知识的运用和推理具有直接的影响。
所谓知识表示是为描述事实所作的一组约定,是知识的系统化过程。
对于任何问题,求解之前必须先用某种方法或几种方法的混合来表示问题。
问题表示的优劣,对求解结果及费用开销的影响很大。
因此,开发专家系统的关键是对专家知识的表达和运用。
图1-1知识的三维空间描述
其实,一个具体专家系统的建造和完善的过程,就是一个不断地重复“获取知识―表示知识―运用知识―进一步获取或修正知识”的循环过程。
另外,在解决同一问题时,不同表示方法可能产生完全不同的效果。
因此,为了有效地解决问题,必须选择合适的表示方法。
1.2.2知识的类型
专家系统是对特定领域的问题求解,而领域是千变万化的,因此,与领域相关的知识的类型也是纷繁复杂的,概括起来主要有以下几种,如表1-1所示。
1.过程性知识描述一个问题是怎样被解决的。
此类知识提供了解决问题的方向、规则、策略和过程等。
2.描述性知识描述对于问题我们知道些什么以及问题求解当前的状态。
如简单的陈述、真假断言等。
3.启发性知识描述与问题有关的信息的知识。
优点是便于表达如何有效处理问题的启发式知识,从而大大减少搜索的代价,并找到较满意的解。
4.元知识[4]是关于知识的知识。
元知识可分为两类,一类是关于我们所知道些什么知识的元知识,另一类是关于如何运用我们所知道的知识的元知识。
表1-1知识的类型
知识类型
描述对象
过程性知识
描述性知识
启发性知识
元知识
规则,过程等
概念,事实等
规则
关于知识的知识
1.2.3知识表示方法概述
研究知识表示方法是AI(人工智能)的中心内容之一。
不论是问题或是系统任务的描述或是知识经验的表示乃至推理决策,都离不开知识。
专家系统作为一种基于知识的智能系统,任务就是处理知识。
对于一个知识表示方法,通常有以下基本要求:
1.具备将问题求解中的各类形式化知识完全表示出来的能力;
2.能使基于知识的推理有效地、符合逻辑地进行;
3.具有良好的结构性,便于知识系统的维护,并有利于推理的进行。
到目前为止,AI研究者己经总结出了一些知识表示技术,如逻辑表示法、规则表示法、框架表示法、语义网络表示法以及面向对象的表示方法等叫。
这里只对较常用的几种知识表示方法作以简单地介绍。
另外.互联网络的异军突起,使得基于XML/HTML的知识表示方法成为知识表示领域研究的热点,这也是本文将要研究的重点。
1.2.3.1产生式表示方法(规则表示方式)
产生式系统(又称产生式规则)是历史悠久且使用最多的知识表示系统,在AI中得到了最广泛的应用。
如:
第一个专家系统DENORAL就是采用这种知识表示系统开发的。
产生式系统用“IFTHEN”的规则形式捕获人类问题求解的行为特征,并通过“认识―行动”循环过程求解问题,其表现形式单一、直观,有利于知识的提取与形式化,其问题求解过程符合人的认识过程,且计算机容易实现,有利于问题求解和专家系统的建立。
1.组成部分产生式系统包括三个基本组成部分,即规则库、全局数据库和规则解释器,相当于专家系统中的知识库、综合数据库和推理机。
因此,基于规则的专家系统也可称为是一种扩充的产生式系统。
2.表示形式基于规则表示的知识库实际上就是一个规则集或称规则库,规则库的常规概念形式为:
IFPremisesTHENConclusion
或通俗地表示为:
IFconditionTHENaction,即“如果满足一定的前提条件,则会产生某个结论或采取某个行动。
”
3.优点
(l)简单、自然、直观、易于表达、理解和应用;
(2)模块化。
每条规则描述一个单独的概念;
(3)既可以表示说明性知识,也可以表示过程性、启发性知识,有利于控制说明性和过程性命题之间的相互作用;
(4)易于跟踪动作发生和变化的轨迹。
1.2.3.2框架表示方法
任何事物的状态、属性、发展过程及相互之间的联系往往具有一定的规律性。
这种规律性的知识经过提炼后,形成了人们认识事物的一种固定形式。
框架系统正是用来表示这种经验性知识的一种知识表示方法。
1.框架框架(Frame)是一种组织和表示知识的数据结构,通常用于描述具有固定形式的对象。
框架由框架名和一组用于描述框架各方面具体属性的槽(Slot)组成。
每个槽又有一个槽名,对应的取值称为槽值或填充值(Filler)。
在较复杂的框架中,槽的下面还可以进一步区分为多个侧面(facet),每个侧面又可以有各自的取值,作为对槽的进一步说明。
在框架知识表示中,还经常使用缺省值(OEFAULT)侧面和附加过程侧面。
缺省值侧面用于说明该侧面的默认取值或典型取值;附加过程侧面用于说明槽值的计算过程和填值时要做的动作。
2.框架之间的关系框架系统是一种结构化的知识表示方法,可分为类框架和实例框架两种。
通过引入类--超类(AKO)及实例--类(ISA)关系来表示框架之间的包含关系和属于关系。
一组相关的框架用表示AKO及ISA关系的指针连结起来就形成了框架系统。
框架理论将知识看成相互关联的成块组织,与产生式规则表示方法有很大的不同。
3.框架的特点
(1)结构化的知识表示方法,适合于表示典型的概念、事件和行为。
(2)框架之间可以形成层次的或更复杂的关系,组成一种框架网络,代表整体的知识结构,可以表示复杂的知识内容。
(3)附加过程是框架系统的重要特征之一,它们使得描述性知识和过程性知识紧密地融合在一起,有机地形成一个一体化系统。
(4)继承性支持概念抽象和信息共享,在框架系统中起了极其重要的作用。
1.2.3.3面向对象的知识表示方法
传统的知识表示方法包括产生式规则、框架、语义网络、谓词逻辑等,它们各有特点,但都结构化不强。
随着规则或对象的增加,因为表示不能模块化,规则和对象间的关系变得愈来愈复杂,系统将难以管理。
当对象或规则被修改时,要准确地指出其对整个系统的影响是很困难的。
面向对象(Object-oriented)方法与传统方法不同,它不是完全从外部功能,而是强调从内部结构模拟客观世界,它追求的是现实问题空间与解空间的近似或直接模拟,为实际问题建立一个可用软件实现的模型,使复杂系统的开发变得清晰和灵活,并能提高软件的可重用性、可移植性、可扩充性和兼容性。
1.面向对象方法的基本概念面向对象方法用对象表示客观事物,靠消息传递建立客观事物间的联系,协同完成各项活动,进而得到问题的解。
对象、消息、方法、类和继承是面向对象技术中的五个基本概念。
●消息―是请求对象执行某一处理的要求。
●对象―描述客观世界中的事物,是本身具有一定知识和处理能力的实体。
●方法―刻画了对象对所传来的消息做出的反应。
●类―概括了一组相关对象所共享的信息,以及对信息的处理。
●继承―使新定义类具有己定义类中的信息和处理能力,以便克服信息的冗余和处理的低效。
2.面向对象方法的基本特征面向对象方法的核心特征是抽象性、封装性、继承性和多态性。
(1)抽象性是客观实体内在本质方面的组成,它忽略了偶然性.
(2)封装性是把数据结构和操作组合在一起,是一种信息隐蔽技术,适用于基本概念的讨论。
它强调对象而非行为,即把相应的行为封装在对象中,以便将对象的使用者和设计者分开,从而加快软件开发速度。
(3)继承性是自动地共享类、子类中数据和方法的机制,允许通过描述它们与现有对象的不同特点来定义新的对象,便于知识的增加、更新和维护。
(4)多态涉及发送信息给不明类型的对象,需要继承性来体现。
从本质上看,多态是指不同的类型可以共享一个方法名,一个名字有多个语义,亦即同一消息可以根据发送消息对象的不同而采取不同的行为方式。
多态简化了程序员的任务。
3.面向对象的知识表示在面向对象的知识表示中,知识表示的基本构件是知识类(class)和知识对象(Object)。
其中知识对象是对知识类进行实例化的结果,它表示领域中的实体或抽象所对应的知识。
一个知识对象由与它有关的属性和方法来描述,属性反映了知识对象的静态特性。
知识类之间最基本的关系是继承,子类可以继承父类的特性和行为。
知识对象的下层有规则、框架、函数和隶属函数.知识对象类定义了所有知识实体的共同属性和方法,这些属性和方法可被其各子类继承。
面向对象的知识表示方法具有以下优点:
(1)基于“继承”所产生的天然层次和结构性。
在高层次,对象能封装复杂的行为,使具体细节对该层知识的使用保持透明,从而降低了问题描述、计算推理的复杂程度。
(2)基于对象本身定义所产生的包容性、灵活性。
它可以是数据,也可以是方法;可以是事实,也可以是过程;可以是框架,也可以是语义网络。
(3)面向对象的抽象机制实际上是将对象看成了客观世界及其映射系统的分形元,因而事物都可由这些分形元堆垒而成。
随着人们对面向对象方法的深入认识和求解复杂问题的需要,面向对象方法将得到越来越广泛的应用,并在知识处理系统中成为一种潮流。
1.3基于XML的知识表示概述
互联网络的飞速发展促使了XML技术的产生。
和HTML一样,XML也是网络上的一种通用语言。
但是HTML更像一个易用的阅读器,简单实用而不精确。
XML则不同,它的产生就是要通过标记来精确地表现信息的各种含义[5]。
XML包含大量“自我解释”性的标识文本,每一个表示文本又由若干规则组成,这些规则可用于创建标识,并能用一种常常称作解释程序的简明程序处理所有新创建的标识。
这样,XML便能够让不同的应用系统理解相同的意义,从而创建一种任何系统都能读出和写入的世界语。
正是由于这些标识的存在XML能够有效地表达网络上的各种知识,为信息的交换和计算提供新的载体训。
XML相对于网络计算的应用,完全可以与计算机起步阶段ASCⅡ码的作用相提并论。
XML也可以说是网络信息的标准代码,它表示的不是符号信息,而是知识化的块状内容。
这种标准语言虽然不是程序设计语言,但它表示的却是在网络上互操作的光明前影。
XML作为数据交换和网络计算的基础,将无可争议的成为网络通用的语言。
而且,可以预见,在正在到来的后PC时代,XML将扮演着核心的角色。
通过XML来表达知识、传递数据,不仅跨越了平台(XML具有天然的与平台无关性),还跨越了空间(Internet的范围扩展到无线),更跨越了设备(XML的数据与表现的分离可以成为不同的终端间交换信息的载体)。
因此,基于XML的知识表示是很有意义的。
第二章XML概述
在本章当中首先给出了XML的一个简单介绍,说明了基于XML的应用的诸多优点,同时给出了XML文档的一个规则描述,提出了应用XML的基本步骤,并给出了基于XML的管理系统的总体方案设计。
2.1XML综述
网络技术发展到今日,的确已渗透到社会生活的每一个角落。
而令网络如此平易近人,为大众所接受,单靠TCP/IP是远远不够的,由此,HTML—超文本标识语言便应运而生,并以其简单精练的语法、极易掌握的通用性与易学性,使WEB网页可以亲近于每一个普通人,互联网也才得以普及发展以至今日的辉煌[6].无论是公司,政府机构,还是个人;无论是成功的企业,个人网页的设计人,还是小学课堂,网络和它最初用以表达信息的方法HTML都获得了圆满的成功。
这样看来HTML可以解决绝大部分问题了。
但是,一些独具慧眼的人却己经认识到HTML有着无法解决的局限性。
1HTML的局限性
随着电子商务、电子图书、远程教育等全新领域的异军突起,迅猛发展并逐渐成为互联网世界必不可少且愈发重要的组成部分,随之而来的是要求HTML构建的WEB文件的复杂化、多样化、智能化,于是高容量、高信息量、高效率便成为网络信息传输技术发展的追求。
与此同时还有另一种需求变得愈发广泛而迫切,那便是同样的数据能否根据不同用户不同需求而以不同的效果、形式表达、再现出来。
而HTML只是一种表达的技术。
它并不一定能揭示HTMLtag中说揭示的含义。
举一个最简单的例子:
Apple
这句话在网络浏览器中有特定的表现,但是HTML却并没有告诉我们它到底是什么。Apple只是一个英文单词罢了,它在不同的环境之下可能会有不同的意义:
是一个计算机公司,一个水果,还是一个姓氏?
HTML并没有告诉我们Apple具体的内容。
HTML中有一个大问题就是它的tag的集合是固定的。
用户不能新增有意义的能供他人使用的tag。
网络浏览器是一个应用平台,以HTML作为数据标准,网络上的应用程序依赖服务器上的CGI(公共网关接口)脚本来处理网页上的数据。
这样的结构是非常清晰的,但HTML却使在服务器的一端要处理的数据量过大。
这使得网络速度降低,效率不高。
2XML的产生
SGML(通用标记语言标准ISO8879:
1986)是HTML的前身技术。
它是文件和文件中信息的构成主体。
SGML与HTML不同,它允许用户扩展tag集合,允许用户建立一定的规则。
SGML所产生的tag集合是用来描叙信息段特征的,而HTML仅仅只是一个tag集合。
所以我们可以说HTML是一个SGML的子集。
XML开发者源于SGML的设计和应用者。
他们己经在SGML上投入了大量精力,但他们却发现SGML并没有完全发挥它的作用。
于是,他们打算让SGML以全新的面目出现在网上,给SGML以全新的面貌,故给它命名为“可扩展标识语言”,即XML。
工作组制定了一个雄心勃勃的计划来展示XML特色的计划。
计划的实施分三部分:
(1)XML的句法;
(2)XLINK(可扩展链接语言):
用来实现XML的语义链接;
(3)XSL(可扩展样式表语言):
用来处理XML的表现:
3XML的影响
在下面这些方面XML带来的影响可以说是一场革命:
(1)对EDI的支持
EDI就是电子数据交换。
它是网络发展的一个主要目的市场。
结构化信息的一个主要目的就要使数据交换成为可能。
不同的工业都制定本工业统一的模型。
就像是不同的国家有着不同的语言,以便于本国文化的交流。
不同的工业内部信息用统一的模型标识,便能方便和高效地共享。
很明显的,网络是一个理想的电子数据的集散地。
在这里HTML是显然有缺陷的数据形式。
HTML不能完全表示不同工业中所需的不同的令人满意的模型和它的语义。
能不能有一种新的语言来解决这个问题呢?
答案就是XML。
(2)对Java技术的帮助
Java技术是本世纪最重要的技术发展之一。
Java使浏览器工作时就像在通用的应用平台上,而平台与平台之间却是独立的。
但固定的tag集合和HTML语义上的贫痔使得Java的应用受到了极大的限制。
正如前面提到的,在盯ML中不同的语义无法表现。
故数据元中丰富的信息得不到一种统一的表示。
XML却能完全胜任这份工作。
HTML页面要依赖网络服务器上的CGI脚本来表现几乎每一个编程函数。
这显然使服务器工作量太大。
有了XML和Java技术,更多的应用软件处理起来将不占用多少网络通信量。
这使得网络更加快捷,客户可以同时应用多个应用软件。
XML真正使得Java有了用武之地。
(3)信息独立于平台
XML是一种平台之间互相独立的信息技术。
这便于指定信息语义的结构。
当企业正忙于展开各种各样的信息格式时(比如微软的RTF,Adobe的Postscript和MIF,以及WordPer
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 本科 毕业设计 基于 XML 知识 管理 系统