论文部分内容阅读
目的:
互联网发展的下一阶段主要以语义网为主,在语义网体系结构中本体是用于描述概念及概念之间的语义关系的核心层。目前国内外对本体的研究很多,各领域都在各自专家的参与下构建自己的领域本体。其中,在本体的构建过程中存在一些问题:首先是质量难以保证。本体的构建需要花费大量的人力物力来搜集领域内各种概念术语及概念之间的关系,由于人为地因素容易出现领域概念搜集的不完全,概念关系定义的不准确等情况,影响本体建设的质量;其次是概念关系描述的不一致。目前对于领域本体的建设没有一个统一的知识组织体系,本体中对于概念关系的描述使用不同的标签,导致本体之间语义互通性降低了,也降低了本体的重用性。
本体与形成于上世纪50年代未的叙词表都是信息组织的一种方法。传统的文献信息组织所使用的叙词表已非常完善和成熟,它是在标题词语言和元词语言的基础上借鉴了分面组配的原理形成的一种基于概念分面组配的知识组织工具。叙词表中有大量的叙词和非叙词,基本涵盖了领域内的概念术语。
因此,将传统的成熟的叙词表作为本体的概念来源和语义关系基础,进而在此基础上构建高质量的领域本体,实现语义网环境下资源的语义互通,达到改进和完善语义网环境下的知识组织体系的目的,并且能为在传统叙词表的基础上构建本体提供实践依据。
方法:
《医学主题词表》中的概念数量庞大且复杂,本研究仅节选《医学主题词树状结构表》(Medical Subj ect Headings-Tree Structure, MeSH)(http://www.nlm.nih.gov/cgi/mesh/2006/MB_cgi)D大类中的化学制品与药物类(Chemicals and Drugs)主题词,以卡西霉素(Calcimycin)为具体实例,用SKOS的概念集定义主题词间的语义关系,利用XMLWriter写出基于SKOS的叙词表表达框架,最终实现基于SKOS的领域本体构建。具体过程分三个阶段,基于SKOS的叙词表转换机制研究及转换示例的SKOS代码表达,转换示例的本体构建。
结果:
本研究选择D大类化学制品与药物类中的主题词作为转换示例对象,利用SKOS标准描述了以Heterocyclic Compounds为主题词类目体系的语义关系网络,构建主题词“Calcimycin(卡西霉素)”及其下位主题词的“Heterocyclic Compounds”领域本体。
结论:
本文引入了W3C推荐的知识组织体系SKOS作为叙词表到本体转换的标准,基于此标准尝试构建所选医学主题词片段的领域本体。基于SKOS的叙词到本体的转换研究,一方面叙词表作为在语义网中的描述语言,避免了重新构建本体的繁重工作,又有效的利用了传统知识管理(叙词表)的已有成果。另一方面,SKOS虽然不是领域知识本体,但它提供了一种通用的模型对现有叙词表进行转换,相当于模型的中间层,也可以在此基础上建立资源与概念的关系,这比基于叙词表直接构建领域本体要简单、容易。基于SKOS的叙词表领域本体的构建方法、过程和步骤对于具有今后本体的构建有一定的借鉴意义。