地理本体匹配

来源 :华南师范大学 | 被引量 : 0次 | 上传用户:aiyanxiyanxi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,网络地理信息系统发展迅速,但彼此数据和服务共享能力差。学者们希望借助语义Web中的本体等技术来提高共享能力。然而,由于尚未创建本体的统一方法和理论,导致不同团体或个人创建的地理本体存在异构,需要借助本体匹配技术解决此问题。由于地理数据具有规模大、涉及领域概念广,以及概念分类层次明显等特点,通用本体匹配技术用于地理本体时存在时间效率低等不足。所以,本文致力于提高大规模地理本体匹配的时间效率展开研究。 本文归纳分析了本体匹配技术的研究现状和地理本体的特性,针对现有本体匹配技术在OAEI(Ontology Alignment Evaluation Initiative,即本体匹配评估活动)竞赛应用中所暴露出对大规模本体匹配时,时间效率低等问题,借助本体分块理论在时间复杂度上的优越性,设计了适用于地理本体匹配的LODBM算法,并以该方法为核心构建了地理本体匹配工具(简称GeoMatch)。 首先,在LODBM算法中调用两个基于语言的相似度算法计算地理本体中各概念间的相似度,把相似度超过设定阈值的概念集合(且这些概念在同一子树上)作为一个语义模块以实现本体分块;再计算两本体中待匹配块的顶层概念的相似度以确定匹配块。最终,根据语言级和结构级的算法计算两本体对应匹配块内各概念间的相似度,采用顺序和并行相结合的策略组合各算法所得相似度值,从而得到两本体间各概念间的最终相似度,确定最终匹配对。 在实现GeoMatch时,以java语言为主,借助本体处理Jena API和WordNet词典查询JWNL API。在此系统的基础上,利用国际组织OAEI提供的标准测试本体Russia对本文构建的匹配工具的效果进行了测试,并利用信息检索领域的查全率、查准率和F—Measure测试值对实验数据进行了统计分析。从实验结果来看,GeoMatch工具具有良好的效果。同时特别比较了采用LODBM本体分块算法和不采用LODBM算法时的时间效率,发现用LODBM算法对地理本体进行分块再匹配在时间效率上提高了20%。
其他文献
文本作为知识的主要载体,是人类获取信息的主要来源。但随着知识和文本数量的增长,人们发现利用知识的难度也在增加,人们与知识之间的距离在不断增大,迫切需要一种简便的文本知识
随着计算机技术的发展,计算机在煤矿开采中的应用已越来越广泛,其中包括在煤矿通风解算方面中的应用。但目前的通风解算软件基本上是通过手工的方式来获得煤矿环境数据,然后
随着电力行业体制改革不断深化,电能量计量管理系统越来越显现出它的重要性。国内的许多科研单位,制造厂商和各级电力公司均投入了大量的人力财力开展这方面的开发研究和工程实施工作。本数据采集系统是电能量计量管理系统的重要组成部分。随着电子技术的迅速发展和市场业务需求的不断提高,用于终端采集与传输电量数据的旧系统已经略显陈旧和过时,为了获得更高的系统性能和更好的交互性、满足未来市场的需要,系统的硬件体系结构
随着互联网和通讯技术的飞速发展,社会步入了移动互联时代。社会越来越多行业对室内定位需求越来越迫切。例如室内机器人,即时医疗和智能工厂等。室外定位已经有一系列非常成熟
极向场控制系统是HT-7超导托卡马克中关键的控制子系统,主要完成装置实验期间对等离子体的电流、水平位移和垂直位移的控制。原有的极向场实时反馈控制系统,等离子体的位置反馈
本文介绍了定量蛋白质组学中一个较为年轻和重要的新课题:基于质谱的非标记定量。基于质谱的非标记定量技术不使用同位素标记等化学手段,而是通过对质谱原始数据的分析和处理来
IMS体系结构中非常重要的一部分就是各种形式的应用服务器,IMS系统中增值业务都是通过应用服务器来实现。Presence是多媒体通信中非常重要的一种通信方式,在这样的背景下实现
生物识别技术代表了未来身份验证技术的发展方向,而自动指纹识别技术是最可靠、最有效的生物识别技术之一。随着IC产业的发展,指纹识别系统正朝着脱离计算机,以更灵活、实用的方
随着我国金融业改革不断深入发展,银行利用较为成熟稳健的企业内部网络(Intranet),通过与各行业之间企业外联网(Extranet),面向客户提供包含基于互联网(Internet)在内的各类
Ad Hoc网络是一种没有中心节点、无需固定基础设施的多跳无线网络,网络中节点的资源(能量、内存、带宽等)受限,在不少情况下,Ad Hoc网络中的节点能量较难得到补充。另外,由于