论文部分内容阅读
[摘要] 本研究探讨如何基于本体技术来构建知识库,在本体知识库的发展上,我们建议须依照规划、设计、修正、布署及整合扩展5个阶段进行,由于本体知识库主要是由概念架构及其关系所构成,因此,设计阶段是其成效的关键。由结果显示,本研究所提出的发展程序,特别是设计阶段采用的方法,确实可以协助构建者加速本体知识库的建立。
[关键词] 本体论 知识库 描述逻辑 推论
一、前言
本体论(Ontology)原为哲学上探究万事万物并加以归纳分析的学说,由于可用在信息技术中的知识推论功能上,因此,在人工智能中早有应用的相关研究。而近年来的研究,更直接将知识以Ontology表达,并利用XML格式呈现,这种本体知识库即为目前知识应用系统常见的形式之一。构建本体知识库的优劣,直接关系到知识系统的效率,必须谨慎地实施。由于构建本体知识库是将大众的认知予以一致化,并要呈现出统一的信息格式,因此,构建Ontology是一项艺术远胜于技术的工作,这也意味着本体知识库的构建过程充满不确定性及需要大量的时间及人力支持。
本研究的目的即为探讨如何将人为的抽象认知,转化为具体的概念陈述,它包括知识工程人员如何获取领域知识及如何将知识转换并呈现于信息系统中。另外,本研究将上述的发展程序实际应用于数据结构课件资源库的知识体系构建,并以树形结构为先期实验计划,由此评估成效并做为后续发展的参考。在实证中,本研究采用W3C组织所公布的OWL(Ontology Web Language)作为本体知识库的内容格式、以Protégé及OWL plugin为编辑工具及利用Racer为知识的推论工具。
二、本体知识库的发展方式
构建一个特定领域的本体知识库是导入Ontology技术最大的挑战之一。在VanderVet的研究中即曾建议:构建一个本体知识库,没有对错及唯一性的问题,虽然本体知识库是大众对特定领域的共同认知,因此“特定”也可以进一步诠释为某类问题下的知识,但在逻辑上,我们不可假设Ontology是唯一的。
Ontology是由知识的概念定义、属性、实体及关系的集合体,构建这些元素则需要一套发展程序,在过去的研究中曾将开发的程序称为本体工程方法。为有效进行本研究的开发,我们综合了前述研究,并建议开发过程为下列5个阶段:
1.规划。构建团队应至少包含领域专家及使用者,并由团队共同策划准备工作。团队成员必须明白,Ontology不易符合全部的知识表达,因此,没有正确与否的疑虑,只有是否解决问题的要求。此阶段类似软件开发的需求阶段。例如,我们可以列出“树形结构的存储结构有什么?”等问题,通过思考答案的方式,逐渐形成Ontology的架构雏型。
2.设计。本阶段是将规划的架构予以逐步转换为Ontology的相对元素,亦即:
(1)概念(class):代表本体中对某类实体的集合或概念;
(2)属性(property):代表本体中实体与实体或概念与概念之间的关系;
(3)实体(instance):代表本体中的个别真实例子。
为协助领域专家将认知转换为细节设计,可以借助各种资料分析方法,例如,本研究利用正规概念分析法(FCA)来理清复杂的概念及属性关系,FCA专门定义显性关系,之后,再利用数学的计算方式,协助领域专家进一步确认其它未定义的关系。
3.测试修正。前述的设计阶段应已逐步完成Ontology的显性知识(explicit knowledge),我们再由推论来获得进一步的隐性知识(inferred knowledge),由于推论过程应用了逻辑中的集合及其它逻辑的组合,因此,由推论而来的知识必须再检验正确性。本阶段主要的验证工作为利用推论器,对知识进行一致性(consistency)的测试,当不一致性的状况产生时,应回到设计阶段修正。
4.开发布署。Ontology通过由逻辑推论所衍生的本体知识库,此时已可响应该领域的特定问题,为降低一般使用者在操作上的障碍,通常通过开发Web-based的前端介面,达成知识资源的分享。前端接口除使用Ontology为知识的主要来源外,也可通过资源的连结,使知识架构更为完整。
5.整合及扩展。Ontology 的再利用包含整合及扩展两个方向,整合是指再利用其它的本体知识库,例如,数据结构为强化关于算法的知识表达,可能需要高级语言的本体知识库来说明。扩展则是指Ontology是否能提供外界的再利用,例如,数据结构中为说明文件的存储状况,必须借助操作系统的本体知识库。
三、应用描述逻辑模型
构建本体知识库的目的是提供可重复使用的知识来源,而描述逻辑是补足Ontology在知识呈现所缺少的推理依据。Diego et al的研究指出,知识库包含TBox(T)及ABox(A)两项基础组件,TBox是以“词汇”来组成,它代表对事物认知的“概念”,Ontology将领域建立为概念及子概念的阶层架构。于是,该Ontology成为一个知识的概念分类,而在概念中的实体也因此有了包含关系,由于知识是认知之间进行交互作用的结果,概念层的包含关系并不能完整呈现其中的复杂性。Donini et al.(1996)指出:ABox是以宣告“关系”的方式来定义对知识的其它说明,因此,ABox补足复杂性的描述,通常通过逻辑式来完成。图1是参考自Baader et al关于知识呈现使用描述逻辑的架构图,其中描述逻辑是用来协助描述两项组件的内容,图中的推论机制须通过由两项组件已知的知识,产生间接或可推导的隐藏知识,知识库则做为推理或应用程序的信息来源。为加速在设计阶段对描述逻辑的应用,我们归纳常用的方式及情境,制作成概念逻辑模型、属性限制模型及模型补充,并制作成通用模式,如下图:
四、结论
本研究主要探讨以Ontology为基础的知识库构建中,如何解决领域专家、知识工程人员及信息系统等在构建过程中的问题。由于本体知识库构建方式具有高度的人为依赖性,因此,构建的技术及策略并没有固定的形式,本研究将构建过程区分为规划、设计、测试修正、布署及整合扩展等阶段进行,为获得Ontology 所须要的概念及其关系,我们利用正规概念分析法将真实世界的认知予以收集,并发展常用的逻辑类型模式,以降低转换为信息系统格式的障碍。
参考文献:
[1]郑义明.SCORM 2004 教材与学生学习管理系统重构.2007.
[2]吴金红.一种基于本体论的知识检索原型系统.情报杂志,2004,(11):45-47.
[3]李楠,孙济庆.支持语义检索的知识检索模型.情报学报,2005,(6):708-712.
[4]Gillam,L.,Tariq, M.,Ahmad,K..Terminology and the construction ofontology.Terminology,2005,(11):55-81.
[关键词] 本体论 知识库 描述逻辑 推论
一、前言
本体论(Ontology)原为哲学上探究万事万物并加以归纳分析的学说,由于可用在信息技术中的知识推论功能上,因此,在人工智能中早有应用的相关研究。而近年来的研究,更直接将知识以Ontology表达,并利用XML格式呈现,这种本体知识库即为目前知识应用系统常见的形式之一。构建本体知识库的优劣,直接关系到知识系统的效率,必须谨慎地实施。由于构建本体知识库是将大众的认知予以一致化,并要呈现出统一的信息格式,因此,构建Ontology是一项艺术远胜于技术的工作,这也意味着本体知识库的构建过程充满不确定性及需要大量的时间及人力支持。
本研究的目的即为探讨如何将人为的抽象认知,转化为具体的概念陈述,它包括知识工程人员如何获取领域知识及如何将知识转换并呈现于信息系统中。另外,本研究将上述的发展程序实际应用于数据结构课件资源库的知识体系构建,并以树形结构为先期实验计划,由此评估成效并做为后续发展的参考。在实证中,本研究采用W3C组织所公布的OWL(Ontology Web Language)作为本体知识库的内容格式、以Protégé及OWL plugin为编辑工具及利用Racer为知识的推论工具。
二、本体知识库的发展方式
构建一个特定领域的本体知识库是导入Ontology技术最大的挑战之一。在VanderVet的研究中即曾建议:构建一个本体知识库,没有对错及唯一性的问题,虽然本体知识库是大众对特定领域的共同认知,因此“特定”也可以进一步诠释为某类问题下的知识,但在逻辑上,我们不可假设Ontology是唯一的。
Ontology是由知识的概念定义、属性、实体及关系的集合体,构建这些元素则需要一套发展程序,在过去的研究中曾将开发的程序称为本体工程方法。为有效进行本研究的开发,我们综合了前述研究,并建议开发过程为下列5个阶段:
1.规划。构建团队应至少包含领域专家及使用者,并由团队共同策划准备工作。团队成员必须明白,Ontology不易符合全部的知识表达,因此,没有正确与否的疑虑,只有是否解决问题的要求。此阶段类似软件开发的需求阶段。例如,我们可以列出“树形结构的存储结构有什么?”等问题,通过思考答案的方式,逐渐形成Ontology的架构雏型。
2.设计。本阶段是将规划的架构予以逐步转换为Ontology的相对元素,亦即:
(1)概念(class):代表本体中对某类实体的集合或概念;
(2)属性(property):代表本体中实体与实体或概念与概念之间的关系;
(3)实体(instance):代表本体中的个别真实例子。
为协助领域专家将认知转换为细节设计,可以借助各种资料分析方法,例如,本研究利用正规概念分析法(FCA)来理清复杂的概念及属性关系,FCA专门定义显性关系,之后,再利用数学的计算方式,协助领域专家进一步确认其它未定义的关系。
3.测试修正。前述的设计阶段应已逐步完成Ontology的显性知识(explicit knowledge),我们再由推论来获得进一步的隐性知识(inferred knowledge),由于推论过程应用了逻辑中的集合及其它逻辑的组合,因此,由推论而来的知识必须再检验正确性。本阶段主要的验证工作为利用推论器,对知识进行一致性(consistency)的测试,当不一致性的状况产生时,应回到设计阶段修正。
4.开发布署。Ontology通过由逻辑推论所衍生的本体知识库,此时已可响应该领域的特定问题,为降低一般使用者在操作上的障碍,通常通过开发Web-based的前端介面,达成知识资源的分享。前端接口除使用Ontology为知识的主要来源外,也可通过资源的连结,使知识架构更为完整。
5.整合及扩展。Ontology 的再利用包含整合及扩展两个方向,整合是指再利用其它的本体知识库,例如,数据结构为强化关于算法的知识表达,可能需要高级语言的本体知识库来说明。扩展则是指Ontology是否能提供外界的再利用,例如,数据结构中为说明文件的存储状况,必须借助操作系统的本体知识库。
三、应用描述逻辑模型
构建本体知识库的目的是提供可重复使用的知识来源,而描述逻辑是补足Ontology在知识呈现所缺少的推理依据。Diego et al的研究指出,知识库包含TBox(T)及ABox(A)两项基础组件,TBox是以“词汇”来组成,它代表对事物认知的“概念”,Ontology将领域建立为概念及子概念的阶层架构。于是,该Ontology成为一个知识的概念分类,而在概念中的实体也因此有了包含关系,由于知识是认知之间进行交互作用的结果,概念层的包含关系并不能完整呈现其中的复杂性。Donini et al.(1996)指出:ABox是以宣告“关系”的方式来定义对知识的其它说明,因此,ABox补足复杂性的描述,通常通过逻辑式来完成。图1是参考自Baader et al关于知识呈现使用描述逻辑的架构图,其中描述逻辑是用来协助描述两项组件的内容,图中的推论机制须通过由两项组件已知的知识,产生间接或可推导的隐藏知识,知识库则做为推理或应用程序的信息来源。为加速在设计阶段对描述逻辑的应用,我们归纳常用的方式及情境,制作成概念逻辑模型、属性限制模型及模型补充,并制作成通用模式,如下图:
四、结论
本研究主要探讨以Ontology为基础的知识库构建中,如何解决领域专家、知识工程人员及信息系统等在构建过程中的问题。由于本体知识库构建方式具有高度的人为依赖性,因此,构建的技术及策略并没有固定的形式,本研究将构建过程区分为规划、设计、测试修正、布署及整合扩展等阶段进行,为获得Ontology 所须要的概念及其关系,我们利用正规概念分析法将真实世界的认知予以收集,并发展常用的逻辑类型模式,以降低转换为信息系统格式的障碍。
参考文献:
[1]郑义明.SCORM 2004 教材与学生学习管理系统重构.2007.
[2]吴金红.一种基于本体论的知识检索原型系统.情报杂志,2004,(11):45-47.
[3]李楠,孙济庆.支持语义检索的知识检索模型.情报学报,2005,(6):708-712.
[4]Gillam,L.,Tariq, M.,Ahmad,K..Terminology and the construction ofontology.Terminology,2005,(11):55-81.