论文部分内容阅读
摘要:语义网是当前Web的扩展,是WWW发展的核心技术之一。为了实现语义网,需要有丰富的且及时更新的本体。本体作为语义网的知识表示模型很好地解决了语义层次上Web信息共享和交换的问题。而本体的构建及其形式表示方法,是建立语义web的基础和核心。论文从 Ontology的基本理论出发, 基于基本概念、角色和关系,探讨了Ontology领域概念化模型的建立。
关键词:Ontology基本概念;角色概念;概念模型
中图分类号:TP311文献标识码:A文章编号:1009-3044(2010)22-6220-02
Ontology原本是一个哲学概念,用于描述事物的本质,是对客观存在的系统的解释和说明。后来Studer等人给出了Ontology详细的概念[1]:“Ontology是共享概念模型的明确的形式化规范说明”。从中可以提取四层4层含义:Ontology中体现的是共同认可的知识,反映的是相关领域中公认的概念集;通过抽象出客观世界中一些现象的相关概念而得到概念模型;所使用的概念及约束都有明确的定义;最后Ontology是能被计算机处理即可读的。
本体为特定领域的人和应用系统的交流提供了一种通用的知识共享模式。本体的研究和应用已经延伸到知识工程、自然语言处理、信息检索系统、智能信息集成和知识管理、信息交换和软件工程等领域。在被称为下一代Web的语义网Semantic Web中,本体是解决语义层次上 Web 信息共享和重用的基础。如何对不同领域内的知识进行抽取和描述,并构建出合适的领域本体是研究热点之一。
1 本体建模
1.1 本体及其建模元语
ontological是一个个实体,是现实世界中的某个领域的概念化的表示或显式说明,其中包括概念和概念之间的关系。一般情况下,它包括一个术语的词汇表以及词汇意义的一些相应说明。
在研究本体领域概念化模型时,重点是研究本体构建及其形式表示方法。这是建立语义web的基础和核心。首先进行概念分类和识别(基本概念、角色概念与角色拥有者等);然后,研究不同语境下角色的性质,及关于角色于扮演者的公理;第三,研究角色概念间的关系。在这个过程中涉及到的Ontology元模型的基本要素如下:
1) 领域概念(类)是对象的集合,指类似于工作描述、行为、功能以及推理过程的一切事务。这个集合包括对概念的解释以及概念间的关系。因此,在定义领域概念时,应该先对专业领域进行深层的认识,使其更加贴近领域的客观实体及其之间的关系。
2) 领域概念的属性是指具体一类对象所具有包括数据属性和关系属性在内的特征。数据属性是非领域中概念,它的属性值为基本类型值,关系属性描述的是领域中两个概念间的关系,其属性值为领域中的另一概念。
3) 基本概念、 角色概念和角色拥有者角色概念[2]是一个概念在语境中所扮演的角色,健全的Ontology的建立需要将其他概念与角色概念进行明显的区分。“基本概念”不需要别的概念来定义,如“人”,“树”等;角色概念是一个事物在特定的语境下扮演的角色,它表达了一个角色, 不过它要通过别的概念来定义。一个角色概念由角色持有者、类约束和语境3个元素构成。而角色持有者是扮演角色的概念实体,例如丈夫作为角色持有者扮演了丈夫这一角色;类约束是对于类的约束,语境是通过与一个概念间的关系辨明角色。例如在“学校”这个语境中有不同的角色,例如“老师”和“学生”,不同的人扮演着这些角色,而扮演这些角色的人就成为了角色持有者。
考虑到角色概念是从基本概念中继承了一些属性作为它的类约束,我们把基本概念的属性划分为两类:B1:不能由角色概念继承的属性;B2:可以由角色概念继承的属性。进而,角色概念的属性也就可分为两类:R1: 在角色概念内新增加的属性;R2:从基本概念上继承的属性。而新增加的属性又可分成两类:从基本概念那儿继承下来,再在属性中增加约束;没有在基本概念中定义的新的属性。
角色拥有者由基本概念和角色概念的和构成,由于B2和R2是等价的,所以角色拥有者是R1、B1和R2(B2)的和构成。例如,由基本概念“人”和角色概念“学生角色”构成了角色拥有者“学生”。“角色拥有者”不是基本概念的子概念,是基本概念扮演的角色。
4) 领域概念间的关系主要有4类:1)属性关系(Attribute of);2)概念继承关系(Kind of);3)整体和部分关系(Part of);4)类和实例关系(Instance of)。此外,在实际建模过程中,概念间的关系不限于上述4种,还可根据领域的具体情况定义相应的关系。
如“is-a”描述的是“超-子”概念关系,子类继承父类的全部属性[3]。对于〈李先生is-a人〉〈李先生is-a老师〉这两种is-a关系来说,显然前者是符合is-a关系的特性的。而对于后者,当李先生不再从事老师时,也就不再具备老师的属性,即老师不是李先生的固有属性,因此,将“李先生”作为基本概念“人”的实例,而“人”扮演了角色概念“老师角色”并因此成为角色持有者“老师”。
“art-of”描述的是部分与整体之间概念的关系。整体概念是由部分概念组成的,而通常角色概念为部分概念。因此当“整体概念”实例被创建后,其所有的“部分概念”实例同时也被创建。例如〈汽车车轮“part-of”汽车〉表示汽车轮是组成汽车的一部分,汽车轮扮演前轮的角色而成为角色持有者“前轮”,此时可以看出“前轮”也是“车”的一部分。
“attribute-of”是指属性概念及其所对应的概念间关系的表示。例如某实体如“西瓜”具有“颜色”、“重量”等属性。
上述三种关系也是概念间的基本关系。
1.2 传统本体建模方法
目前,由于本体工程仍然处于相对不成熟的阶段,各工程都有自己独特的背景,其使用的方法并没有普遍性。
1.2.1 IDEF5方法[4]
具体步骤:1) 确定本体建设项目的目标、观点和语境,并为组员分配角色;2) 收集本体建设所需要的原始数据;3) 为抽取本体做准备,进行数据分析;4) 从收集的数据当中建立一个初步的本体;5) 对本体的进行精炼与确认,完成本体构建。
IDEF5方法是一种结构化的方法,这个方法在于获取现实世界客观对象的定义,以及它们的属性和它们之间的内在联系。利用该方法,可以有效地开发和维护领域本体。
1.2.2 Mike Ushold
关键词:Ontology基本概念;角色概念;概念模型
中图分类号:TP311文献标识码:A文章编号:1009-3044(2010)22-6220-02
Ontology原本是一个哲学概念,用于描述事物的本质,是对客观存在的系统的解释和说明。后来Studer等人给出了Ontology详细的概念[1]:“Ontology是共享概念模型的明确的形式化规范说明”。从中可以提取四层4层含义:Ontology中体现的是共同认可的知识,反映的是相关领域中公认的概念集;通过抽象出客观世界中一些现象的相关概念而得到概念模型;所使用的概念及约束都有明确的定义;最后Ontology是能被计算机处理即可读的。
本体为特定领域的人和应用系统的交流提供了一种通用的知识共享模式。本体的研究和应用已经延伸到知识工程、自然语言处理、信息检索系统、智能信息集成和知识管理、信息交换和软件工程等领域。在被称为下一代Web的语义网Semantic Web中,本体是解决语义层次上 Web 信息共享和重用的基础。如何对不同领域内的知识进行抽取和描述,并构建出合适的领域本体是研究热点之一。
1 本体建模
1.1 本体及其建模元语
ontological是一个个实体,是现实世界中的某个领域的概念化的表示或显式说明,其中包括概念和概念之间的关系。一般情况下,它包括一个术语的词汇表以及词汇意义的一些相应说明。
在研究本体领域概念化模型时,重点是研究本体构建及其形式表示方法。这是建立语义web的基础和核心。首先进行概念分类和识别(基本概念、角色概念与角色拥有者等);然后,研究不同语境下角色的性质,及关于角色于扮演者的公理;第三,研究角色概念间的关系。在这个过程中涉及到的Ontology元模型的基本要素如下:
1) 领域概念(类)是对象的集合,指类似于工作描述、行为、功能以及推理过程的一切事务。这个集合包括对概念的解释以及概念间的关系。因此,在定义领域概念时,应该先对专业领域进行深层的认识,使其更加贴近领域的客观实体及其之间的关系。
2) 领域概念的属性是指具体一类对象所具有包括数据属性和关系属性在内的特征。数据属性是非领域中概念,它的属性值为基本类型值,关系属性描述的是领域中两个概念间的关系,其属性值为领域中的另一概念。
3) 基本概念、 角色概念和角色拥有者角色概念[2]是一个概念在语境中所扮演的角色,健全的Ontology的建立需要将其他概念与角色概念进行明显的区分。“基本概念”不需要别的概念来定义,如“人”,“树”等;角色概念是一个事物在特定的语境下扮演的角色,它表达了一个角色, 不过它要通过别的概念来定义。一个角色概念由角色持有者、类约束和语境3个元素构成。而角色持有者是扮演角色的概念实体,例如丈夫作为角色持有者扮演了丈夫这一角色;类约束是对于类的约束,语境是通过与一个概念间的关系辨明角色。例如在“学校”这个语境中有不同的角色,例如“老师”和“学生”,不同的人扮演着这些角色,而扮演这些角色的人就成为了角色持有者。
考虑到角色概念是从基本概念中继承了一些属性作为它的类约束,我们把基本概念的属性划分为两类:B1:不能由角色概念继承的属性;B2:可以由角色概念继承的属性。进而,角色概念的属性也就可分为两类:R1: 在角色概念内新增加的属性;R2:从基本概念上继承的属性。而新增加的属性又可分成两类:从基本概念那儿继承下来,再在属性中增加约束;没有在基本概念中定义的新的属性。
角色拥有者由基本概念和角色概念的和构成,由于B2和R2是等价的,所以角色拥有者是R1、B1和R2(B2)的和构成。例如,由基本概念“人”和角色概念“学生角色”构成了角色拥有者“学生”。“角色拥有者”不是基本概念的子概念,是基本概念扮演的角色。
4) 领域概念间的关系主要有4类:1)属性关系(Attribute of);2)概念继承关系(Kind of);3)整体和部分关系(Part of);4)类和实例关系(Instance of)。此外,在实际建模过程中,概念间的关系不限于上述4种,还可根据领域的具体情况定义相应的关系。
如“is-a”描述的是“超-子”概念关系,子类继承父类的全部属性[3]。对于〈李先生is-a人〉〈李先生is-a老师〉这两种is-a关系来说,显然前者是符合is-a关系的特性的。而对于后者,当李先生不再从事老师时,也就不再具备老师的属性,即老师不是李先生的固有属性,因此,将“李先生”作为基本概念“人”的实例,而“人”扮演了角色概念“老师角色”并因此成为角色持有者“老师”。
“art-of”描述的是部分与整体之间概念的关系。整体概念是由部分概念组成的,而通常角色概念为部分概念。因此当“整体概念”实例被创建后,其所有的“部分概念”实例同时也被创建。例如〈汽车车轮“part-of”汽车〉表示汽车轮是组成汽车的一部分,汽车轮扮演前轮的角色而成为角色持有者“前轮”,此时可以看出“前轮”也是“车”的一部分。
“attribute-of”是指属性概念及其所对应的概念间关系的表示。例如某实体如“西瓜”具有“颜色”、“重量”等属性。
上述三种关系也是概念间的基本关系。
1.2 传统本体建模方法
目前,由于本体工程仍然处于相对不成熟的阶段,各工程都有自己独特的背景,其使用的方法并没有普遍性。
1.2.1 IDEF5方法[4]
具体步骤:1) 确定本体建设项目的目标、观点和语境,并为组员分配角色;2) 收集本体建设所需要的原始数据;3) 为抽取本体做准备,进行数据分析;4) 从收集的数据当中建立一个初步的本体;5) 对本体的进行精炼与确认,完成本体构建。
IDEF5方法是一种结构化的方法,这个方法在于获取现实世界客观对象的定义,以及它们的属性和它们之间的内在联系。利用该方法,可以有效地开发和维护领域本体。
1.2.2 Mike Ushold