论文部分内容阅读
在异构数据的信息集成和语义检索以及本体映射中,解决语义匹配一直以来都是一个难题。本体能够明确表示一定领域的概念和概念之间的关系,利用这一特点,本文进行基于本体的语义匹配的研究。在基于本体的知识表示中,多个领域本体间不可避免的存在语义冲突,如何解决这些冲突正是语义匹配的研究内容。研究表明,可以通过计算概念间的语义相似度来衡量两个本体之间的语义关系。同时,概念的实例、概念的属性和概念的结构层次关系都在一定程度上体现了本体间的关系。目前已有的基于关键字语义匹配方法都有其内在的缺陷,本文在研究现有方法的基础上对其进行了改进,得到综合概念的实例、概念的属性和概念的结构层次关系的语义相似度计算模型。在该模型中,首先用概念及其实例的联合分布概率计算概念之间的相似度;然后结合统计学模型和图形学方法计算概念属性的相似度;并在一定属性匹配规则下找到某个概念通过该属性指向的下一层概念的语义相似性,最后递归地调用概念相似度的方法来计算各个概念的相似度,从而将各个层次上所有概念的相似度加权综合得到本体间的语义相似度。本文构建了一个消防装置领域的本体,对该构建好的的本体进行了语义匹配的模拟实验,并对算法进行了改进前后的对比。实验表明,该模型能够用来计算本体间的语义相似度,改善了召回率和准确率。最后,通过JNI在Java环境中引入了MPI类库,探索了在Java环境中实现并行计算的思路。实现了Java与C的互操作,也为该模型在并行计算环境中的执行提出了一个有效的解决方案。