论文部分内容阅读
目前,网络地理信息系统发展迅速,但彼此数据和服务共享能力差。学者们希望借助语义Web中的本体等技术来提高共享能力。然而,由于尚未创建本体的统一方法和理论,导致不同团体或个人创建的地理本体存在异构,需要借助本体匹配技术解决此问题。由于地理数据具有规模大、涉及领域概念广,以及概念分类层次明显等特点,通用本体匹配技术用于地理本体时存在时间效率低等不足。所以,本文致力于提高大规模地理本体匹配的时间效率展开研究。
本文归纳分析了本体匹配技术的研究现状和地理本体的特性,针对现有本体匹配技术在OAEI(Ontology Alignment Evaluation Initiative,即本体匹配评估活动)竞赛应用中所暴露出对大规模本体匹配时,时间效率低等问题,借助本体分块理论在时间复杂度上的优越性,设计了适用于地理本体匹配的LODBM算法,并以该方法为核心构建了地理本体匹配工具(简称GeoMatch)。
首先,在LODBM算法中调用两个基于语言的相似度算法计算地理本体中各概念间的相似度,把相似度超过设定阈值的概念集合(且这些概念在同一子树上)作为一个语义模块以实现本体分块;再计算两本体中待匹配块的顶层概念的相似度以确定匹配块。最终,根据语言级和结构级的算法计算两本体对应匹配块内各概念间的相似度,采用顺序和并行相结合的策略组合各算法所得相似度值,从而得到两本体间各概念间的最终相似度,确定最终匹配对。
在实现GeoMatch时,以java语言为主,借助本体处理Jena API和WordNet词典查询JWNL API。在此系统的基础上,利用国际组织OAEI提供的标准测试本体Russia对本文构建的匹配工具的效果进行了测试,并利用信息检索领域的查全率、查准率和F—Measure测试值对实验数据进行了统计分析。从实验结果来看,GeoMatch工具具有良好的效果。同时特别比较了采用LODBM本体分块算法和不采用LODBM算法时的时间效率,发现用LODBM算法对地理本体进行分块再匹配在时间效率上提高了20%。