基于混合聚类的大本体分块映射及评价方法研究

来源 :中南大学 | 被引量 : 0次 | 上传用户:y3434jkhgkj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本体映射旨在不同的本体间搭建语义桥梁,以期实现不同本体间的信息交流和知识共享。对于大规模本体,由于其概念数量庞大、相互之间关系复杂,要实现大本体之间的映射变得非常困难。本文将着重从大本体映射方面展开研究。首先,论文对语义Web的研究背景、SNAX系统的研发目的、当前本体映射的研究现状以及大本体划分工作进行了介绍。其次,根据大本体的结构及特点,应用向量空间模型(VSM)技术,提出了一种基于混合聚类的类层次本体自动聚类分块方法。该方法通过提取概念信息中的词干来构建向量空间,并运用语义扩散算法将概念表示在向量空间中,然后应用混合聚类算法实现概念的自动聚类。并根据块中概念间的相似度,提取出最后的映射。再次,鉴于目前大本体映射领域中尚缺少对本体自动分块的评价体系。本文结合自动聚类分块的特点,提出外标准和内标准,作为本系统分块质量评估参考。最后,根据上述研究,本文设计并实现了大本体分块映射系统BMC。并在此系统的基础上,利用现实领域中提供的测试数据集russia12和tourismAB对系统的映射效果进行了测试,同时用POP法和Rand法对分块结果进行评价,利用信息检索领域的查全率、查准率和correctness映射结果进行评价,并对实验数据进行了统计分析。从实验结果来看,此方法具有良好的效果。
其他文献
无线传感器网络是一种新的信息获取和处理技术,它具有自组织、快速展开、抗毁坏性强等特点,在军事、环境监测、医疗健康、工业控制等方面有着十分广阔的应用前景。近年来,随
医学断层图像三维可视化是可视化计算中的一个重要应用领域。现代CT医疗影像设备所获得的医学体数据量越来越多,使得三维可视化所处理的数据量巨大,因此,在保证图像质量的前
当今数字化时代,信息数据量呈现爆炸式膨胀。随着传统本地磁盘存储方式已无法适应要求,新的存储技术开始逐渐发展起来,存储区域网络成为当前网络存储技术发展的主流方向,而基于iS
基于样图的纹理合成是近年发展起来的一种新的纹理合成技术,用于解决传统方法中出现的接缝、扭曲以及参数调整等问题。它在图像编辑、破损图像的修补、数据压缩、网络数据的
随着互联网技术的迅速发展,互联网的应用模式也从最初的页面Web、应用Web,发展到Web服务。然而单个的Web服务已难以满足实际应用的需求,如何组合已有的服务,形成新的服务,已
本体映射是本体重用和本体集成的关键环节,这项技术的发展对语义web中本体查询、推理等应用具有重要意义。本文将着重对此进行研究。首先,简要介绍了课题的研究背景,总结了本
《代理银行财政集中支付系统——银行业务子系统》是配合财政支付系统改革的银行端业务应用系统,该系统实现了财政对银行的业务需求,包括:额度管理、凭证管理、授权支付、直接支
在信息化社会里,特别是随着电子商务,电子政务的发展和广泛应用,信息安全显得格外重要。为了保证电子支付、电子合同、电子投票、电子文件等电子信息的安全性,数字签名随之产生。
报表引擎是报表工具软件的核心组成部分,它控制报表系统的运行过程,为灵活多变的企业级报表展示提供强有力的软件支持。在研究报表引擎工作原理、Eclipse插件、RCP、XML、OSG
随着计算机体系结构的发展,多核平台得到了越来越广泛的应用。多核平台与并行计算理论相结合,以多线程并行的方式使应用程序性能大为提高。然而在图形领域,多核平台的应用尚未展