知识模型基础知识.docx
- 文档编号:28374884
- 上传时间:2023-07-10
- 格式:DOCX
- 页数:27
- 大小:36.40KB
知识模型基础知识.docx
《知识模型基础知识.docx》由会员分享,可在线阅读,更多相关《知识模型基础知识.docx(27页珍藏版)》请在冰豆网上搜索。
知识模型基础知识
知识模型基础知识
一绪论
知识是一个很复杂的研究对象,知识系统是庞大而错综复杂的。
知识模型的研究包含知识组织结构研究和知识处理两个方面。
因此,本文主要分为两大部分来展开论述:
领域知识表示模型研究和领域知识处理模型研究。
1需要研究和解决下列问题:
1)学科领域知识的表示;(知识的表示和描述,并与各类学习技术规范接轨)
2)学科领域知识的组织与交互关联;
3)学科领域知识的有序化;
4)学科领域知识处理模型
2研究内容:
分析领域知识结构,建立基于概念网的知识表示模型。
需要从宏观到微观表示复杂的领域知识体系,不同层次上的概念在结构上的复杂程度和关联关系上应该是不同的。
按照不同层面知识的不同特点可将概念网模型分为上、中、下三个层次。
最上层模型描述学科知识,中层详细描述领域知识,底层模型是对中层模型的补充。
根据三个层面知识的不同特点,分别构建模型。
中层概念网模型以本体论为指导思想构建,从对象的观点来认识概念,把基本概念看成是一个个的对象,具有属性、行为、概念描述、概念词等复杂特征,进而由基本概念衍生出派生概念和复合概念等。
在模型中,概念网可简化为概念树表示。
在此基础上根据树的层次关系计算概念树中节点的距离,将概念节点距离计算简化为纯数学计算。
底层概念与概念之间通过关联关系形成一个复杂的底层概念网络,知识之间也建立起推理的依据。
(1)从知识的本质出发,以学科领域知识为对象,逐步深入地分析领域知识的表示方法并对概念网模型进行研究。
(2)通过分析不同层次的知识表示,领域知识的层次结构分析,构建静态领域知识模型和动态领域知识模型,,给出能够详细表示知识内容的中层概念网络模型以及建构方法,确立三层概念网络的领域知识组织与表示模型。
(3)研究领域知识中层概念网建构,运用本体论的方法详细描述中层概念网模型的构建和表示。
(4)探索概念节点在概念树中的数学模型。
通过定义概念各种关系时的不同距离计算方法,将抽象的概念联系转化为形象的概念距离。
3基于知识的学习资源组织
在“知识爆炸”的网络信息时代,核心知识增长并不大,而各种通过继承、交叉、发展而派生的知识,以及分散在各种出版物、网页的外围资料却在与日俱增,导致了知识存储状态的无序化。
因此,组织学习资源的唯一途径是围绕着知识这个内核组织资源。
(1)知识组织
是对知识内容进行分析,找到人们创造与思考的相互影响及联系的结点,像地图一样把它们标示出来,以展示知识的有机结构,为人们直接提供创造时所需要的知识和信息。
可称其为“认识地图”或“知识地图”。
“认识地图”实际上是通过相互引证的文献之间的内部联系来绘制的,即首先分析相互引证文献,查明是什么思想、观点和理论被后继论文引用;如果被引事项可以用一个简单的陈述来表示,则该陈述可以分解为有限数量的概念(即数据)。
这样绘制的“地图”使每个知识单元就像一个结点和地址,处于创造它们的逻辑位置上,通过引证相关与其它结点联结,形成一个有机整体展示知识利用和生产的动态过程。
通过这个“地图”,人们可以直观地观察到知识单元怎样加入到人的创造过程中,并发挥其作用。
“认识地图”还可作为指南,指出学科发展的疑点、难点、热点、空白点及突破点,提供探索的路标。
当此“认识地图”逐渐扩大并趋于稳定时,便可以作为数据库实现纯信息(或知识)检索。
(2)思想基因
“思想基因”是人的思想高逼真度的复制品,可以通过一定的方式结合成复合体,具有存在和繁殖能力,如同生物的遗传一样。
“思想基因”的遗传变异导致了知识的继承和生产。
S.塞恩从“思想基因”出发,指出了目前知识组织方法的不合理性,建议按所谓“思想基因进化图谱来组织知识。
他认为可以从文献中找出“思想基因”,按自然进化方式聚类,形成“思想基因串”,从而编制出新型的概念索引,供人们利用。
所谓“思想基因”,实际上就是知识生产创造过程中起着关键作用的那些思想。
这些思想同样可以表示为一个简单陈述,而陈述则可以分解为有限数量的概念。
这些概念在人类创造过程中的有序重组,就表现为各种定理、法则、定律和公式。
有人也称“思想基因”为“知识基因”或“信息基因”。
(3)超大规模知识库
国家知识基础设施NKI是一个庞大的、可共享的、操作化的知识群体,在以下3个方向展开研究:
第一是知识的形式化本体理论。
内容包括:
知识的上下文、结构性、时变性、模块性、层次性、知识本体的视图和超视图、知识的一致性、知识的可视化(knowledgevisualization)、知识动画(knowledgeanimation)、知识本体的总体不确定性(“墒”)、知识本体的覆盖率、本体及其成份的相似度、本体成份的重要性、难度等。
第二是大规模知识获取与处理。
知识获取是知识工程的瓶颈问题,也是NKI建设的一个关键问题。
它重点研究知识获取自动化的理论和技术,并重点研究从《中国大百科全书》和其它的知识源中获取知识。
不同的学者对某些事物可能有相反的认识,因而他们有些知识是相互矛盾的,尽管它们都有一定的可用性。
NKI研究矛盾知识处理的理论和技术,在尽可能发现NKI中的矛盾知识同时,引导人们如何使用矛盾知识。
NKI作为一种新型的知识服务,它将面向不同文化层次的用户。
例如,在教学系统中,必须将一个知识模型分成不同的层次,在学生的不同学习阶段分别传授给学生。
第三是NKI支撑下的应用研究。
NKI中的知识不仅丰富而且专业,这为研制各种基于知识的高技术应用系统提供了知识基础。
在NKI支撑下,其重点研制以下几类应用系统:
计算机辅助教学、电子知识工具、自然语言理解、机器翻译、文字自动校对系统、模式识别系统、专家系统、大规模计算机辅助设计、计算机辅助医学、网上试验平台、计算机辅助决策、知识发现、分布式人工智能、自动推理、进化计算、智能计算机等。
二领域知识模型
1领域知识宏观模型分析
领域模型的构造应接近实际的教学方式,即由学习单元与概念、案例之间互相关联构成的知识网络。
作为基本的教学单元,学习单元之间存在着聚集关系、前提关系和推导关系。
系统同时支持基于任务的学习方式,任务由若干学习单元的组合而成。
领域知识模型的确立需要识别领域知识的基本结构与特点,分析知识模型的功能,寻找适当的知识表示方法,将通过分析领域知识结构,确立知识模型。
知识的表示研究的是知识在计算机中的表示方法,属于人工智能的知识工程范畴。
知识表示是系统中最为核心的问题,知识的存储方式,逻辑推演方式,都与之密切相关。
在某种意义上,说它是最重要的问题并不过分。
知识表示的成功与否直接关系到系统智能化的程度。
对于一个知识表示方法,通常有如下要求:
1)具备将问题求解中的各类形式化知识完全表示出来的能力;
2)能使得基于知识的推理有效地、符合逻辑地进行;
3)具有良好的结构性,便于知识系统的维护,并可有利于推理的进行。
学科领域知识涉及众多复杂的科学概念,概念之间又有复杂的关系,如何表示概念的内涵,如何表示概念之间的关系,以及如何通过关系的描述灵活理解和产生新的概念是学科领域知识表示的重要任务。
因此,网状结构的知识体系在各种知识的组织手段上起着重要的作用。
而知识结点的粒度应该可粗可细,可以是一个概念,也可以是框架或嵌套子网,联系可以是简单联系,也以是多种语义联系,概念与概念之间联系在一起构成复杂的知识系统。
概念网络是最适合表示大型复杂知识网络的知识模型。
概念网的功能分析
概念网节点的框架模型可以将概念的属性和行为封装在一个结构中。
因此概念节点可以作为一个整体描述知识对象;概念网的层次结构性适合表示领域知识的结构性和系统性;概念网规范的网状结构可以表示知识对象之间的各种关联关系。
概念网作为面向学科的领域知识表示和知识组织模型,应该具备下列功能:
1)构造学科知识的概念谱系
构造概念谱系也是进行知识聚类和分类的过程。
知识聚类是将知识按一定的聚类标准分门别类地加以类集和序化的过程。
知识聚类可分为以学科聚类、以主题概念聚类,以人聚类、以用聚类、以时空聚类五种类型,它们是相互独立的聚类体系。
概念网模型从概念的属性描述出发,可以灵活地实现多种聚类。
2)知识分类。
知识分类是指将客观知识按其逻辑关系组织有序,从而体现客观知识的逻辑结构的过程。
概念网模型应支持以客观知识内容的多种相关性为依据而建立的多种有序化结构。
3)知识对象识别
识别事务通常有两种途径:
①通过事物属性,②通过事物之间的关系。
属性包括性状、功能、行为等,事物之间的关系有相似、不同、因果等。
因此,概念网应该描述所表征的知识对象的主要属性、相互的区别和相互的关系。
概念网络的层次划分
在建构学科知识系统过程中,会遇到两方面的问题:
1)用基本模型表示简单的知识结构和关系,概念网的知识处理能力太弱。
2)由领域专家随意扩展,对属性和关联进行复杂的表示,概念网进行知识推理的程序却很难做到普适性。
分析领域知识结构特征确立知识模型是进行知识处理的基础。
通过分析领域知识的特点,结合表征知识的模型所应具备的功能可确立新模型,以领域知识的三个层次:
学科层、基础层、扩展层为基础将概念网模型划分为上层、中层、下层三个层次。
上层概念网用基本模型简洁表示,中层概念网采用本体论建模方法和领域专家一起各个击破,采用更复杂的模型,中上层概念网都采用精确描述,底层概念网在中上层概念表示的基础上,用归纳推理方法产生。
1)学科层概念网。
也称作上层概念网,以一级学科为根结点,概念网中的节点是二级学科的重要概念,是一棵关于学科的知识分类树。
上层概念网的结构是很简单的,不对知识的细节进行表示,主要功能是表示学科知识的分类。
上层概念网的缩减模型:
上层概念网表示的是学科级的概念,可以说是被扩大一定限度的概念,它包含了众多的科学概念,是抽取了所有被包含概念的共同本质属性而形成的,因此它可以由它所包含的概念表示。
2)基础层概念网。
也称作课程概念网或中层概念网。
以课程为单位组织和表示该领域的基础理论知识和核心技术。
中层概念网需要详细地表示概念的性质、概念的内涵、及其在不同语境中的语义;还需对概念的结构和关联作出规范化说明。
由于中层概念网与上、下层概念网均有交叉,所以中层概念网的构建是知识表示的关键。
中层模型的扩展:
中层概念网建模希望该层概念网能够像一个专业人士一样具有清晰的知识结构,把概念之间的复杂关系,能够对概念进行灵活分类和组合;又希望概念网模型规范化具备普适性和可操作性。
3)扩展层概念网。
也称作底层概念网。
是指知识不断发展过程中向其自身或其它领域扩展深化时产生的知识。
扩展包括知识本身的深化和细化、学科交叉产生新的知识领域的扩展和知识应用产生的新技术知识扩展。
底层概念网的模糊表示策略:
在底层概念网构建时,始终把握概念是对知识的抽象这个关键。
因此对概念的描述也应从知识中提取出来。
底层概念网的表示从形式上说侧重描述概念的特征。
领域知识的概念网构建
确立知识模型构建知识库是进行知识处理的基础。
结合学科知识对领域知识概念网的构建过程作进一步说明。
建构领域知识概念网就是建构一个领域知识库系统。
该知识库不同于人工智能传统意义上的知识库。
概念网络是描述概念及概念之间关系的概念模型,通过概念之间的关系来描述概念的语义,可以看作一种特殊的语义网模型。
但是它和一般的语义网相比,不仅表示的对象不同,结构形式上有很大差别。
因此,在具体模型建构上也是完全不同的。
2领域知识模型的组织与表示
领域知识的组织和表示是适应性学习支持系统中的一个核心组成部分,领域模型是对领域知识的抽象表示。
领域建模的目的就是要揭示出课程教学中的各种元素及其相互之间的关系,即课程中的知识(事实和规则),并且用形式化的方法描述和表示出来,领域建模其实质是领域知识库的建立过程。
首先分析领域知识建模的对象一领域知识中的各种元素及常用的关系,从不同的角度对其进行分类,阐述知识表示的基本原则;接着对领域知识表示的若干方法进行分析比较。
教学领域知识元素
(1)课程
course或者lesson,通常指具有完整知识体系的学习对象,对于一门课程,通常都和下列信息关联:
1)教学要求即学习目标;
2)一个或多个教师,负责该课程的教学;
3)学生,课程学习的主体;
4)学习的内容,通常由若干章组成。
2)章
chapter,比课程稍小的学习对象,其包含的内容关联密切,一般代表了课程内的子目标,是一个相对完整的教学单位。
通常一章中,也会有导引、总结、练习等内容,一章通常由若干节组成。
3)节
section,比章小的学习对象,往往针对某个较小的具体教学目标,通常由一个或几个密切联系的知识点组成。
4)知识点
KnowledgeItem或者Concept,通常指最小的知识逻辑单元。
5)学习对象/知识对象
learningobject/knowledgeobject,通常泛指各种学习材料,粒度大小不一,能够在技术支持的环境下使用、重用或引用的实体((LOM定义)。
LOM模型中,对学习对象的描述信息即元数据进行规范化。
在早期的一些文献中,知识对象的含义也与学习对象的含义类似。
5)学习单元
unitoflearning(或Learningunit),在荷兰开放大学EML建模规范和IMS的学习设计规范中,以学习单元作为建模的对象,它通常是指诸如一门课程、一个模块、或一节课等教育片段的一个抽象术语,不仅包含了需要学习的有序的资源集合,还包括各种各样的行为(问题求解、搜索、讨论、对等评估等)、评价、服务和教师或其他成员提供的支持设施。
显然,在IMS定义中,它是一个包含学习资源和学习过程的一个教学活动,对其粒度的粗细并没有加以限制。
在本文中,也将借用这个术语,但是特指一个较小的学习活动,是构成课程的逻辑上不可再分的基本学习对象,它包含一定的学习目标、学习导引、学习材料、练习等等。
6)素材
material,通常是教学内容中的基本元素,对应最小粒度的学习对象。
比如:
文本、图片、动画、一段声音、视频等。
教学领域知识元素间的关系
现实世界中领域知识元素(对象)之间的关系是复杂多样的,但在系统实现时,需要建模的关系类型往往是根据系统的复杂程度和需要而进行选择。
在教学系统建模中,常用的知识元素之间的关系有:
(1)聚集关系(构成关系)
某一对象是由其他对象组成,反映出他们的构成关系。
例如:
课程由许多章组成;一个学习任务包含多个学习单元;一个学习单元包含目标、前提、角色、活动、环境;一个复合知识点由若干个知识点组成等。
(2)继承关系(一般/特殊关系)
继承关系用来表达类属关系或特化关系,表示子对象是父对象的一种特例,子对象继承了父对象的一些特性。
例如:
参与学习过程的对象有教师、学生、职员等,这些教师、学生、职员都是一种角色,他们继承角色的某些属性(姓名、年龄等)信息,同时他们又都承担不同的责任;在教学过程的活动,既有学生的学习活动,也有教师的支持活动,他们都是一种活动,具有活动的共同特征,但又有所区别。
(3)关联关系
对象之间既不是构成关系,也不是继承关系,而是相互之间存在一定的关联。
例如:
在一个学习过程中,学习者、学习活动、学习环境三种对象之间是相互关联的,可以描述为学习者在一定的学习环境开展学习活动;一个学习单元往往围绕一个或多个概念而展开的,学习单元与概念之间存在关联;一个测试或练习项目其目的也是考察对针对某个概念掌握程度;论坛中所讨论的一个问题往往也隶属于某个学习单元,或者是针对某个概念。
(4)依赖关系
对象之间虽然不直接关联,但是存在一定的依赖关系。
比如:
在适应性学习支持系统中,呈现某个页面的条件依赖于学生的某些属性等。
(5)前提关系
它用来描述教学内容之间本身就存在的固有的逻辑联系,如某个知识点是另外一个知识点的逻辑前提;也可用来表示教师对教学内容呈现顺序的安排,哪个知识点先学,哪个知识点后学等。
前提关系是教学策略的体现,是实现教学内容序列化(排序)的重要关系。
(6)推导关系
推导关系是在实现适应性教学过程中,可以利用的另外一种关系,它表示当系统观察到用户掌握某些知识点的时候,可以推导出用户对其他知识点的掌握情况。
前提关系用来产生学习顺序,推导关系用来让系统判定知识掌握程度,实现知识的传播。
另外,对于领域知识元素之间,可以建立的关系还可以有很多,比如:
案例关系:
表示某部分内容是针对另外一部分内容的案例。
扩展关系:
表示某部分内容是关于另外一部分内容的扩展。
知识元素之间的关系种类越多,系统就越复杂,但其可支持的系统灵活性就越高。
领域知识信息模型是以学习单元为中心,建立起课程元素之间的相互联系,包括学习单元之间的前提一后继关系、推导关系、以及树状的课程目录结构。
课程的结构组织成章、节、知识点的形式,对每个页面指定了其进入的前提概念集合和输出概念集合。
领域模型由若干概念组成,概念之间规定了前提(prerequisite)关系和进入值(即前提概念必须获得适当的分值后才能进入后面的概念),每个概念有若干个页面与其关联,每个页面为该概念贡献一定的分值。
教学领域知识的分类与特性
(1)教学领域知识的分类
在基于知识的智能系统中,根据知识在系统中所发挥的作用,知识可分类为事实性知识,过程性知识,控制性知识。
事实性知识用于领域内的有关概念、事实、事物的属性及状态。
过程性知识一般是通过对领域内各种问题的比较与分析得出的规律性的知识,由领域内的规则、定理及经验组成。
对于一个智能系统来说,过程性知识是否完善、丰富、一致将直接影响到系统的性能及可信任性,是智能系统的基础。
控制性知识又称为深层知识或者元知识,它是关于如何运用已有的知识进行问题求解的知识,因此又称为“关于知识的知识”。
教学领域知识库中的知识可分为下面四种类型:
1)教学资料
是指课程本身的教学内容,包括各种素材、页面文件、练习等各种粒度的学习对象等。
这些知识表现为文本或多媒体资料库,应带有检索和复制工具以满足引用知识的需求。
2)结构性知识
是指用来描述教学领域内部各元素之间的静态结构关系的知识。
比如,对象之间的聚集关系、关联关系、依赖关系等。
3)过程性知识
是指反映教学策略、学习顺序、反馈提示等学习活动过程中的知识。
比如对象之间的前提关系、推导关系;练习、测试中的反馈和指导建议等。
4)控制性知识
学习支持系统中,控制性知识是指如何利用结构性知识和过程性知识,表现出对用户的适应性。
控制性知识往往隐含在系统的发布引擎中,通过一定的算法来体现。
在适应性学习支持系统中,后三种知识是系统表现出智能性的关键。
如果把知识库和系统发布引擎与具体的知识内容分离开来,就构成了一个教学专家外壳系统。
这种外壳系统,具有固定的知识表示方式、发布模式和系统表现形式,只需填入相应的课程内容,就形成一个新的教学系统。
概念之间的关系包含两类:
一类反应了超文本系统中点与点之间的物理指向关系((link);另外一类关系反应了概念之间的内在逻辑关系,逻辑关系分为两种类型:
前提关系(prerequisite)和禁止关系((inhibitor),对于前者,假设Cl是C2的前提关系,则表明学习C2之前先要掌握Cl的内容;对于后者,假设C4禁止C1,表明当掌握了C4的内容之后,用户不愿再访问C1了,即表明Cl相对于C4是初级的内容了。
还可以对关系附加“权值”,例如“is_prereq-of”关系附加一个“进入值”(threshold),表示只有前一概念获得一定的权值之后才能学习后一概念。
知识的表示
所谓知识的表示实际上就是对知识的一种描述,或者说是一组约定,一种计算机可以接受的用于描述知识的数据结构。
对知识进行表示的过程就是把知识编码成某种数据结构的过程。
一般来说,在选择知识表示方法时,应从以下几个方面考虑:
I.充分表示领域知识
建模总是意味着抽象,即抽取所要关注的因素而忽略某些次要的因素。
对教学领域建模来说,如果过于简化,忽略的因素过多,将会导致设计的教学系统其实用价值的降低。
因此,在表示领域模型时,应当尽可能充分的表示该领域知识的特征,反映其知识结构、教学策略等特征。
往往需要综合运用多种知识表示方法。
2.有利于对知识的利用
知识的表示和利用是密切相关地两个方面。
“表示”的作用是把领域内的相关知识形式化并用适当地内部形式存储到计算机中去,而“利用”是使用这些知识构造教学支持系统,呈现出有效促进学生学习的系统功能。
显然,“表示”的目的是为了“利用”,而“利用”的基础是“表示”。
为了是一个教学系统能达到预设的要求,除了必须具备足够的知识外,必须使其表示形式便于对知识地利用。
如果一种表示模式地数据结构过于复杂或者难于理解,将会降低系统地效率,影响教学的效果。
3.便于对知识的组织、维护与管理
为了把知识存储到计算机中,除了需要用适当的表示方法把知识表示出来外,还需要对知识进行合理地组织,而对知识地组织与表示方法密切相关的,不同的表示方法对应于不同的组织方式,这就要求在设计或选择知识表示方法时能充分考虑将要对知识进行的组织方式。
另外,在教学系统建成后,经过对一定数量实例的运行,可能会发现其知识在质量或性能方面存在某些问题,此时需要增补一些新知识,或者需要修改甚至删除某些己有的知识。
在进行这些工作时,又需要进行多方面地检测,以保证知识的一致性、完整性等,这称之为知识的维护与管理。
在确定知识的表示模式时,应充分考虑维护与管理的方便性。
4.便于理解和实现
领域知识库地建立是由教师或教学专家来完成地,因此对教学领域知识的组织和分解方式以及教学策略的表示方式应当易于理解,符合教师的思维习惯。
至于实现的方便性,更是显然的。
如果不便于在计算机上实现,那它就是纸上谈兵,没有任何实用价值。
教学领域知识的组织与表示方法
关于教学系统领域知识的组织与表示方法,主要来源于两种途径:
一是对智能教学系统的研究成果,其特点是主要针对支持个别化学习,便于系统推理和问题求解;二是来源于最近几年来各种组织和机构对于学习技术标准化的研究成果,其特点在于强调实现教学资源的重用、共享、检索和可交换性。
目前,世界上有很多标准化(学术)组织都正在致力于基于网络的教育资源标准化的研究,并起草了一些规范,其中影响较大的有:
IMS的LearningResourceMetadata(学习资源元数据规范),IEEELTSC(LearningTechnologyStandardsCommittee,学习技术标准委员会)的LOM(LearningObjectMetadata:
学习对象元数据)、OCLC(OnlineComputerLibraryCenter)DublinCore的DublinCore元数据标准等等。
学习资源元数据标准的建立,及其相应的XML绑定规范,为实现资源的重用、交换、检索奠定了基础,特别是为大规模教学资源的开发,实现可持续性资源建设,保证其投资效益提供了保障。
学习对象元数据标准比较适合于小粒度资源的开发与管理。
但是,首先,由于元数据标准相对比较复杂,描述信息过多,很难为普通的教学系统开发人员在构建学习系统中采用,相对而言,它更适合于大规模教学资源库建设。
其次,在元数据标准中,大部分描述信息是与学习支持无关的元素,它是一个面向技术和机器的标准,主要为了便于实现资源在不同系统之间的交换、检索、可重用、共享的目的,至于如何在学习中应用这些资源的有关教学信息则很少,因而往往不能直接根据这些元数据信息应用到教学过程中。
在实际的学习系统设计过程中,进行课程内容设计时,舍弃不必要的元数据,进行适当的简化,扩展学习系统中需要的属性,是一条实际可行的道路。
比如,通过增加对学习背景、学习风格等元数据对学习对象进行索引,从而支持个性化的内容呈现。
(1)Dublin
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 知识 模型 基础知识