基于XML的元数据近似匹配模型研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:cxr349150
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML技术和元数据技术作为资源对象描述与检索的基础,正在众多领域中得到广泛研究与应用,尤其基于XML的检索技术研究方兴未艾。目前虽有许多面向XML文档的检索方案被提出,但它们都不能在高效率的情况下保证资源的查全率与查准率,难以满足用户多样性的检索需求。本文围绕查全率和查准率的效率问题,引入树匹配思想,对基于XML的元数据检索进行了深入的研究。 本文首先系统地讨论了基于XML的信息检索技术的基本原理和方法,研究了XML检索技术的发展现状,对信息检索中的树匹配理论和相关问题进行了深入探讨。 为提高查全率,本文把无序标签树匹配分解为树结构匹配和标签语义匹配,采用树结构匹配和语义匹配相结合的方法,对传统树匹配算法进行了改进,提出了近似匹配的概念。针对元数据XML描述的树型结构特征,本文设计了一个由树嵌入近似匹配、树包含近似匹配、树包容近似匹配共同组成的三层近似匹配模型,此模型可根据用户的不同需求有效地调节元数据的查准率和查全率。 由于传统的无序标签树的包含问题是一个NP难问题,所以本文在近似匹配模型中根据树匹配检索的结构化特征,通过加入节点之间亲和度的限制条件,使得包含近似匹配代价的计算问题可以在多项式时间内得到解决。本文引入树编辑距离、映射代价等相关理论和动态规划的思想,详细分析了近似匹配模型的匹配代价计算问题,证明了三类近似匹配问题可在多项式时间内求解。 最后,本文利用近似匹配模型以及匹配代价计算,设计了基于XML的元数据查询系统的体系结构和检索过程,构建了元数据查询系统的原型系统,并进行了一系列实验,实验结果表明:近似匹配模型能很好地将查全率和查准率结合起来,在元数据检索的实际应用中具有可行性和有效性。
其他文献
概率分析进化算法是将构造性模型引入进化算法进行研究而形成的一类新型进化算法。贝叶斯优化算法是求解高阶难题中具有代表性的概率分析进化算法。本文主要研究贝叶斯优化算
图像作为多媒体数据的重要组成部分,简单直观、可以快速准确地表达信息,是人类活动中最常用到的信息载体。同时,很多计算机视觉任务的研究,都是以图像的高效表示为基础的。因此,研
随着计算机技术和网络技术的迅猛发展,信息系统不断朝着集成化、智能化、网络化与分布式的方向发展,同时在规模、结构、功能层次及设计实现等各个方面与传统的单机单应用系统相
随着云计算和大数据技术的发展,一方面云数据中心的网络流量迅猛增长、网络设备数量不断增加,另一方面租户提出多样的动态虚拟网络请求,传统网络架构面临着无法敏捷交付和灵活调
随着Internet持续高速的发展,人们开始对其服务质量(QoS,Quality of Service)、可靠性和效率进行重新思考并提出多种解决方案,网络测量技术提供反映IP网络运行状况指标,显示网络
多Agent技术是目前计算机科学领域中一个非常重要、研究活跃的内容之一,近年来引起了学术界和工业界的高度关注和重视。但是当前此项技术尚未成熟,应用面并不系统、广泛,原因之
传统同步机制容易引起进程死锁和进程优先级的翻转,从而影响到操作系统的实时性和稳定性。嵌入式系统功能的复杂化对系统的实时性和稳定性提出了更高的要求。非阻塞同步机制是
动态电子商务是电子商务发展下的一个阶段,以Web服务为其支持技术。Web服务是构建在诸如XML、SOAP、WSDL和UDDI等等这些开放的,技术实现中立的标准之上的一种新的网络应用。它
学位
该文通过对网管系统功能模型、组织模型及信息模型的分析,并结合对Sun公司JMX规范的研究,设计并实现了一套具有分布化、综合化、智能化特点的小额支付平台网管系统.在网管系