论文部分内容阅读
在计算机科学领域,本体被定义为共享概念模型的形式化规范说明。应用本体的主要目的是为了知识共享和复用。因为本体的构造还没有一个统一的标准,所以在同一个领域内产生了大量不同的本体。这些本体之间是异构的,本体映射能很好解决本体异构问题。本体映射的关键是相似度的计算。在语义Web背景下本体映射、信息集成、语义检索等研究领域都需要对广泛使用的异构本体进行语义识别和判断,以达到知识共享的目的。然而现有的本体相似技术还存在一些不足,这主要表现在技术应用性不强,依赖于概念描述的语法结构,而不是本体内部包含的潜在语义。论文通过对现有概念相似度计算方法的分析和总结,提出一种基于概念实例、概念定义、概念名称和概念结构层次关系的综合语义相似度的计算方法。利用机器学习方法计算联合分布概率从而得到概念实例的相似度;结合统计学模型和图形学方法计算概念定义的相似度;并在一定语义半径范围内找出概念的语义邻居,利用计算概念定义相似度的方法计算对应邻居的相似度,从而得到概念结构相似度;利用编辑距离方法计算概念名称相似度。基于综合的语义相似度计算方法进行了模拟实验,利用BP神经网络反复训练样本,建立样本的网络输出与期望输出的误差信号,不断调整网络权值,使网络尽可能去适应样本输入信号的过程。对已经训练好的BP网络,用测试样本进行测试。实验表明,基于BP神经网络的本体映射方法能够用来计算概念间的语义相似度,应用于本体映射。根据单个相似度分量来推测概念间的语义关系是不充分的、有失偏颇的。综合语义相似度更能体现概念间的语义关系,比单个的相似度分量更为有效。BP神经网络具有自学习能力,可通过对样本数据的学习和训练调整模型的权值、阈值。同时模型具有很好的适应性,可以在计算模型基本不变的情况下,通过BP神经网络调节网络权值来适应应用环境的变化。