论文部分内容阅读
随着大数据时代的到来,互联网上的数据呈爆发性地增长。为了更好的运用和共享这些知识,本体在存储和描述知识的优秀性能而被引入语义网。但另一方面本体在开发过程中具有主观性,加上互联网具有分布式的特点,即便是在构建同一个领域本体,不同组织和个人建立的本体也不尽相同,所以出现了在同一领域的本体也不尽相同,这就是所谓的本体异构现象。它们之间通常不能相互操作,不同用户之间也不能够相互理解。为了更加充分的利用这些本体来完成互联网上知识的集成和交流的任务,有必要找出这些本体之间的匹配关系,即使用本体匹配技术消除本体异构现象。本体匹配是解决不同本体之间交互式操作和寻找不同实体之间的匹配关系的重要技术,对实现不同本体的之间的交互非常重要。在大数据的今天,随着本体数量的增长,因此迫切需要一些方法能够自动或半自动地进行本体匹配任务,进一步改进本体匹配系统的匹配效果。单一的本体匹配方法考虑的仅是本体特定的元素,匹配效果不尽如意。本文采用从多个角度对本体进行本体匹配,利用复合匹配方式实现了本体匹配方法。本文主要包含以下内容:(1)对本体的名称进行概念相似度计算。对于给定的两个本体进行基于字符串公式和WordNet词典方法,并考虑到本体的注释信息也能确定本体是否相似,将其引入基于名称的概念相似度计算,综合加权求得最终的基于名称的概念相似度计算。(2)分别对基于属性、实例和结构进行概念相似度计算。利用和积算法对基于实例的概念相似度计算。通过对属性的筛选,简化计算基于属性的概念相似度。并采用基于结构的noisy-or模型进行相似度计算,并将三种算法的值综合加权,获得初始匹配。通过反复迭代得到最终匹配。(3)以所研究的算法为核心,对本文提出的方法进行实验。该实验采用OAEI提供的国际标准评测数据集和评价方法,实验表明该算法的良好性能,能够有效地提高查准率和查全率,并在匹配效率上取得了明显效果。