智能教学系统中知识查询研究

来源 :电化教育研究 | 被引量 : 0次 | 上传用户:fengxiaogang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
   [摘 要] 针对智能教学系统在知识共享与重用及对系统的构建缺乏知识工程化方法方面存在的问题,对智能教学系统中的知识查询进行深入研究,将本体理论应用于智能教学系统的知识表示与知识库的创建模块上,给出一种新的知识查询模式。
  [关键词] 智能教学系统; 知识查询; 本体
  [中图分类号] G434 [文献标识码] A
  [作者简介] 李睿(1971—),女,甘肃秦安人。副教授,硕士,主要从事智能信息处理研究。E-mail:lirui@nwnu.edu.cn。
  
  一、引 言
  随着人工智能理论在教育领域中的广泛应用,智能教学系统的研究已成为人工智能领域的一个研究热点。[1]智能教学系统赋予计算机系统以智能,从而由计算机系统在一定程度上代替人类教师实现最佳教学。国内的智能教学系统研究起步较晚,[2]少量的研究工作主要集中在少数大学与研究机构进行。最近几年则发展较快,许多科研机构、大学、公司纷纷投入到智能教学系统的研发中。
  智能教学系统是一种开放式的人机交互式教学系统,它引入了人工智能的相关技术,模拟教师的教学,可以更好地实现因材施教并进行有针对性的指导,从而调动学生的学习积极性,有助于培养学生的能力。然而,在以往的智能教学系统中存在对学习者的建模不太成功,对较难表示的定义性知识的教学无能为力,对系统和学习者之间缺乏一种互动交流,教学系统之间不能相互通信等问题,即使对于同一学科开发的教学系统往往也很少能重复利用原来已开发的资源(包括功能部件),而是从头开始开发,同时系统维护也很困难,而且不能有效地比较和评价一个已存在的系统。究其原因,是知识共享和重用的问题,是对系统的构建缺乏知识工程化方法的问题。本文针对上述问题,对智能教学系统中的知识查询进行了深入研究,将本体理论应用于智能教学系统的知识表示与知识库的创建模块上,更好地描述一个领域中各个概念及它们之间的关系,便于知识交流、共享及查找。
  二、相关理论
  1. 知识表示
  知识表示是知识工程领域研究的主要内容之一,要通过计算机实现某种活动,必须要解决其行为及该行为所涉及的知识如何在计算机上进行表示,即如何将知识用特定的数据结构进行描述和存储。为了便于知识管理和推理分析,知识表示的方法一般要求简单明了、易于理解,并能对知识进行方便、灵活的扩充。传统的知识表示方法主要有规则、框架、语义网络、逻辑等。[3][4]
  知识表示实际上就是对知识的一种描述,即用一组约定的符号把知识编码成一组计算机可以接受的数据结构,知识表示过程就是把知识编码成某种数据结构的过程。通常来说,同一知识可以有多种不同的表示形式,而不同的表示形式所产生的效果又可能不一样。好的知识表示不仅可以合理、有效地将领域知识组织在一起,同时能为系统提供更加精确的信息查询,而且还可以帮助学生建立清晰的概念关系、良好的知识结构,提高问题的求解能力。[5]近年来,由于将本体引入知识工程领域,知识表示领域又出现了一些新方法。专家认为知识表示由三个主要部分组成:逻辑、本体和计算。逻辑提供了通过逻辑运算从现有知识演绎出新的逻辑描述的功能;本体是对自然事物及其关系的研究,是某个领域事物的符号描述,方便知识共享和重用的实现;计算则是指确定一个描述是否能够从给定描述演绎得出的过程。
  2. 本体模型构造
  本体自从提出以来就被不同的学者给予不同的定义。Gruber认为, “本体是对概念化对象的明确表示和描述”,[6]这也是被目前领域内的学者普遍认同的一个概念。有学者对此定义进行了引申,提出“本体是共享概念模型的形式化规范说明”。[7]有学者则认为本体的概念主要包括以下几个方面:[8]①概念化(Conceptualization):指的是世界中某些现象的抽象模型以及辨识这些现象的相关概念;②明确(Explicit):就是要清晰地定义所有概念的类型以及概念之间的关系约束;③形式化(Formal):不同程度的形式化帮助机器理解本体;④共享(Share):反映了本体捕获同感知识的理念,即不是限定到单个的某些人,而是一组人共同接受的知识。本文将本体理论应用于智能教学系统的知识表示中,用以改善以往智能教学系统中知识理解的程度。
  定义1:领域本体是专业性的本体,提供了某个专业学科领域中概念的词表以及概念间的关系,或在该领域里占主导地位的理论。领域本体是一个四元组O=〈C,I,R,Ax〉。其中:C是本体中的类集;I是类集C中的实例集;R是类集C上的关系集合,类的继承关系(Is a)是最常见的类间关系;Ax是类间公理集合,给出类C的类之间属性和关系的严格约束。
  定义2:领域本体中,术语之间的关系主要有四种:同义词关系(Synonym)、上位关系(Hypernym)、下位关系(Hyponym)和属关系(Positive Association)。
  ①同义词关系:表示相似数据源之间对称的等价关系,即不同本体论中的两个术语有同样的语义;
  ②上位关系:表示一个本体中术语的语义比另一本体中另一术语的语义更普通或更抽象;
  ③下位关系(Mihalcea,2001):表示一个本体中术语的语义比另一本体中另一术语的语义更专业或更特殊;
  ④属关系(Castano,2001):表示一类事物属于另一类事物,如Part-of关系。
  上下位关系是不对称的偏序关系,具有传递性。对于其他术语关系,都可以通过这四种关系推理演绎得出。各概念之间复杂的语义关系组成语义网络图,其中结点表示概念,结点之间连线表示概念之间关系。
  本体开发常采取迭代步骤,即首先定义本体原型,然后修改并细化进化的本体,最后填充一些细节。该过程与其他开发过程一样,在实施过程中并不是线性的,上述过程可能会反复重叠,在开发过程中的任何一点都可能返回到原来的某一步。[9]通常,本体构造的过程如图1所示,其开发过程可分为下面一些主要阶段:
  (1)确定范围
  本体是为特定目的而建立的特定领域的模型,所以,不存在特定领域的“正确”本体。本体须是特定领域的一种抽象,抽象中包含的内容取决于本体被如何使用及预期的扩展。确定本体范围的方法之一是本体应能解答知识基的问题列表,即设计并填写本体性能调查表(Competency Questions)(Gruniger,1995),然后从需求的角度对本体应该支持的性能调查表进行简单的分类。
  (2)考虑复用现有本体
  在语义网快速发展的同时,本体的应用也更加广泛,在定义本体时,从第三方获得可用的本体,作为构建自己本体的一个起点。目前,许多电子格式的本体库是可利用的,并能方便地导入本体开发环境中。
  (3)枚举术语
  本体定义的第一步是写下在该本体中期望出现的全部相关术语的一个非结构化列表。如动词或动词短语是属性名(如Is Part of、Has Component Etc)的基础,名词是类名的基础。梯度分析和网络分析(Laddering and Grid Analysis)等传统知识工程工具可以很好地应用于这个阶段,以建立术语集和这些术语的初始结构。
  (4)定义类层次
  目前有三种开发类层次的方案:
  从上至下(Top-Down)(Sowa,1995b)开发思想是先定义领域中最普遍的概念,然后对概念进行特化。
  自底向上(Bottom-Up)(Van der Vet,1998)开发策略先定义特殊的类,然后把这些类聚合成更普通的类。
  由内往外(Middle-Out)(Uschold,1996)则最先定义更明显的概念,然后对其进行适当的泛化和特化。该方案较容易实现,因为中间概念通常是领域中更具描述性的概念(Rosch,1978)。
  确保这个分层结构是类与子类的层次结构是重要的。也就是说,若A是B的子类,则每个A的实例也必须是B的一个实例,这样才能保证owl:subClassOf和rdfs:subClassOf等原语内嵌语义得到遵守。
  (5)定义类的特性
  单纯依靠类不能提供足够的信息,所以在定义类及其层次后,应描述概念的内部结构,即类的属性,子类可以继承或覆盖父类的属性。
  一般情况下,有四种对象特性能变成本体中的属性:
  ● 固有的特性,如计算机的质量、体积等;
  ● 外在的属性,如计算机的制造商;
  ● 局部,假如对象是结构化的,物理和抽象的部分;
  ● 其他个体间的关系,类的个体成员和其他条目之间的关系。
  (6)定义属性的约束
  约束的不同可以用来描述属性的值类型(Number、Boolean、Instance etc)、允许值(领域或范围)、值基准(单一或多个和最小或最大)以及值的其他特征。以下几个方面描述属性的普通的约束关系:
  ● 属性基数
  基数说明属性有多少值,一些系统分为单一和多个基数,一些系统设定最小和最大基数来描述属性值的个数。还有些属性基数最大设为0,就是为了表示特定子类的属性无任何值。
  ● 属性值类型
  值类型约束描述何种类型的值能够填充属性,如String、Number(Float and Integer)、Boolean(Yes or No)、Enumerated(Symbol)、Instance。
  ● 属性的领域和范围
  属性的领域是属性附属的类,属性的范围是值类型Instance允许的类。当该属性附属于特定的类时,某些系统允许限制属性的范围。
  ● 逆属性
  逆属性的属性值可能会依赖于另一属性的值。通过使用逆属性,知识表示系统能够自动填充另一逆关系的值,从而确保知识基的一致性。
  ● 默认值
  大多基于框架的系统允许定义属性的默认值,若类的多数实例的特定属性值都相同,就可把该值定义成默认值;若类的每个新实例都包含这个属性时,系统自动填充默认值。此外,还可以把该值改为约束允许的其他值。
  (7)生成实例
  实例的数量较大,所以把它们置于本体通常不是手工完成的,实例常由原有数据源(如数据库)中检索得到,另一种方法是从文本库中自动抽取实例。
  总之,本体构造是一个逐步求精的过程,直至符合要求为止。要注意:对于某个领域的本体,不存在一个绝对正确的本体,不同的主体构造出不同的本体;评价本体的质量也只能在实际应用中来进行。
  3. 基于本体论的知识查询
  因为本体是对特定领域的概念及概念之间关系的形式化表示,具有较强的语义属性。因而,利用本体可以克服传统信息检索隔离开词间语义关系的缺点,能够很好地解决因关键词匹配带来的“形义不符、信息冗余”等问题,并能实现基于知识、语义的查询。
  知识查询是基于语义匹配的查询方式,基于本体的知识查询是把借助本体规范后的查询请求按领域与本体标注后的信息资源索引数据库进行语义匹配过程,并将匹配结果返回给用户界面。
  教材中的知识是按照章、节来进行组织的,由于教材本身的局限性,体现出来的只是知识点之间的一种简单的前后次序关系,而各知识点之间的语义以及内容相关关系则无法体现;由于本体的引入,使得用户查询能够与相关知识点关联,很容易找到查询概念的上、下级概念及相关关联,实现在语义对查询作出扩展。[10]
  基于本体的知识查询步骤如下:[11][12]
  (1)在领域专家的帮助下, 建立相关领域的本体知识模型。建立领域本体可以形式化地表示并分析专业领域的知识, 为基于知识的信息检索提供基础。
  (2)对于收集来的数据,按照已建立的本体要求,将数据按本体规定的格式存储在元数据库中。
  (3)对用户查询界面获得的查询请求,查询转换器按照本体分析查询请求,并把查询请求转换成规定的格式,在本体的帮助下从元数据库中找出符合条件的数据集合。
  (4)将查询结果经处理后返回给用户。
  三、智能教学系统的实现
  1. 查询界面
  查询界面是用户与系统进行交互的接口,借助于本体将用户查询规范化,按此查询请求在领域本体知识库中进行查询,从中找出该查询请求出现的各个领域,然后将该领域及在该领域下的含义呈现给用户,此时用户可根据需要选择所需的领域及含义,检索过程结束后,检索界面将检索结果呈现给用户。
  在进行智能教学系统的设计时,考虑到用户大多以自然语言形式提出问题,首先要对自然语言进行分析,即分词处理。由于词典的规模较大,有效的检索方法是将词典按词语的前缀组成一棵前缀树。对词语,它具有一定的词语纠错功能;对于短语,将其组成二叉树,能保证每次搜索总是在当前的子孙结点中进行。
  2. 知识查询语句
  在用户查询界面中,用户提出查询请求或对问题进行验证、评估。系统在给用户提供查询反馈时应以用户的需求为中心。从微观角度可将用户查询分为概念查询、属性查询、关系查询。
  概念查询指对概念名、概念的内涵及定义等的查询。概念描述时包括了概念的定义等属性,对用户来说是概念的定义、中英名称、俗名等方面的知识。
  属性查询是建立在面向对象的知识模型基础上的,考查属性值的特点。对某个概念而言,可将其属性分为类属类属性、方法类属性、实例类属性等,之后再对每一类属性构造查询语句,在每一具体应用中,可以有适当的验证式查询。
  在很多情况下,用户会对概念间的关系进行查询。同一概念内属性间关系的查询与多概念间关系的查询没有严格的界限,在设计思路上也十分相似,均可归结为对关系的查询,但在确定关系的属性分类与概念的属性分类时不完全相同。[13]
  3. 概念—关系模型查询
  在知识库的创建过程中,我们用概念—关系模型存储知识。在该模型中,利用概念、概念的属性、概念的关系以及属性和关系间的约束来表示知识库的组织形式。概念—关系模型将学科知识表示为概念或关系,便于用户进行知识查询。
  由于本体论刻画出了概念之间的内在联系,所以可以借助于本体论,使查询的信息更能满足用户的需求,可以从概念层次、语义层次来查询信息。利用本体论将领域知识概念化是一件比较困难的事情,在此我们把领域层所描述的概念—关系用有向图表示,结点代表概念存储在知识库中。把关系和概念分别存放,并通过一定的关系链接起来,这样便于知识的共享、管理和获取。例如“数据结构”某教学单元的概念—关系的图形化描述如图2所示。
  4. 知识查询过程
  知识查询首先在用户界面输入用户关键词(字),借助于分词模块将用户输入进行分词,然后在本体的帮助下将用户的输入进行规范化,也就是在本体知识库中找到该概念的父概念、子概念及相等概念,若本体中存在这些概念,再找出所有属于这些概念的实例,若本体中不存在这些概念则直接将这些关键字作为实例。利用本体的推理将最终得到的实例返回给用户。然后,对分词结果进行实体转化,把对关键字的查询最终分为概念查询、关系查询和属性查询。对于概念查询是基于知识层面的检索,可对概念进行相关扩展以提高查准率和查全率;对于关系查询是实体中两概念之间的关系,因为实体中关系错综复杂,有时关系的数目比实体本身还要多,关系查询是语义层次的查询,它能挖掘出实体间存在的隐含关系,在较大程度上提高查准率;对于属性查询是依据各实体属性的属性值进行的检索。最后,将查询结果按与查询关键字相关度进行排序,把与用户最相关的检索结果放在前面。知识查询模式如图3所示。
  在智能教学系统的设计中,还存在很多技术难题,如对学生的评估、教学规划、人机自然语言对话处理,等等。其研究的难度主要有:一是它涉及多门学科,而所用到的相关学科的技术即使在本学科也不够成熟,并且这些技术应用于教学系统会产生新的问题;二是人类对其自身的学习过程还认识不足。因此,智能教学系统的研究仍存在相当大的难度。
  四、结束语
  结合国内外学者在智能教学系统方面的研究成果,本文对智能教学系统中的知识查询技术进行了深入研究,并将本体技术应用于智能教学系统的知识表示与知识库的创建模块中,给出一种新的智能教学系统知识查询技术。将本体技术引入智能教学领域的意义在于,本体形式化地表达了领域的隐性知识,能更好地表示并理解一个领域中各个概念及它们之间的关系,便于知识交流、共享及查找。智能教学系统从产生到现在已经有了很大发展,得到了较好的应用,随着计算机科学和认知科学等学科的发展,智能教学系统将会有更好的发展和广阔的应用前景。
  
  [参考文献]
  [1] 张燕姑, 仇芒仙, 徐贯东. ITS的设计与实现[J].山西师范大学学报,2004,18(4):38~43.
  [2] 莫赞, 冯珊, 唐超. 智能教学系统的前瞻[J].计算机工程与应用,2002,(6):6~8.
  [3] E John,J D Ullman.Introduction to Automata Theory,Languages,Computation (Second Edition)[M].Beijing:China Machine Press,2004.
  [4] M Kifer.A Logic for Programming with Complex Object[J].J.Comput.Syst Sci,1993,47(1):77~120.
  [5] 危辉, 潘云鹤.从知识表示到表示:人工智能认识论上的进步[J].计算机研究与发展,2000,37(7):819~825.
  [6] Gruber Ctr. A Translation Approach to Port- Able Ontologies[J].Knowledge Acquisition, 1993,5(2):199~220.
  [7] Borstwn. Construction of Engineering Onto- logies for Knowledge Sharing and Reuse[D].Enschede:University of Twente,1997.
  [8] Fensel D. The Semantic Web and Its Lang- Uages[J]. IEEE Computer Society, 2000,(11,12):67~73.
  [9] 张宇翔. 知识工程中的本体综述[J].计算机工程,2005,31(7):112~114.
  [10] 王晓东. 基于Ontology 知识库系统建模与应用研究[D].上海:华东师范大学,2003.
  [11] 郑杰,纪希禹. 基于本体的语义检索模型[J].科技情报开发与经济, 2007,17(25):119~121.
  [12] 宋炜,张铭. 语义网简明教程[M].北京:高等教育出版社, 2004.
  [13] 陆汝钤. 世纪之交的知识工程与知识科学[M].北京:清华大学出版社,2001.447~505.
其他文献
随着社会经济的发展与进步,大众的生活与质量得以提升,城市的建筑行业与社会经济发展具有相互依存的关系。为了紧跟社会发展的步伐,城市建筑管理也在不断改革。与传统建筑工
[摘 要] 以ISI Web of knowledge收录的文献题录作为数据样本,利用可视化动态网络分析工具——CiteSpace Ⅱ对所采集的数据进行文献共引分析和聚类分析,绘制出E-learning研究发展演进的知识图谱,揭示了E-learning研究的三个不同时期,得出各个时期的代表人物和代表文献,展现了以E-learning相关理论研究、医疗教育应用为代表的热点研究领域,呈现了E-lear
随着社会经济的不断发展和生活水平的不断提高,人们对土木工程项目建设的要求也在日益提高,与此同时,给土木工程管理工作提出了更高的要求。鉴于此,本文从土木工程施工管理过
内部控制的改进与强化具有十分重要的意义,预算管理与绩效考核作为内部控制的重要内容,至关重要。本文结合笔者工作实践经验,就医院加强财务预算管理与绩效考核提出几点个人看法
学生理解学科内容并将其转化为智能的最好方式之一,是“参与”到具体问题情境中学习,而精心设计的教育游戏可提供更加真实的“问题情境”,有效增强“参与度”。本文在对Conceptu
在当前的工程管理中,在确保施工质量基础上,还要加强对设备的检修。而目前很多设备都是通过业务外包的形式开展,这就可能会出现承包商在实际检修方面的问题。文章结合承包商
随着我国高等教育的飞速发展, 高等教育的模式不再是精英教育, 而是转变为大众教育.大众教育的开展和实施, 导致部分高校扩大教学规模、 新建小区以及采用校企合办模式办学等