基于语义的XML近似查询方法研究

来源 :东北大学 | 被引量 : 1次 | 上传用户:feiniao6688
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet技术的发展,越来越多的应用采用XML作为信息表示和数据交换的标准。在对XML数据查询处理的过程中,用户查询意图通常是不明确的或不完整的,这就使得查询具有一定的试探性和渐进性,用户输入的查询条件常常不能准确表达自己的查询目的。另外,XML数据中蕴含的语义信息,包括概念层次关系、相似关系等,对于改善查询的表现具有重要意义。而传统的XML查询技术对查询条件进行精确的匹配,没有考虑到XML文档中的语义信息在近似查询方面的作用,从而导致查询结果无法反映查询者在语义上的近似要求。因此,如何有效利用XML数据中的语义信息,返回与用户需求最为相关的查询结果成为一个亟待解决的问题。基于上述需求,本文提出一种基于语义的XML近似查询方法。该方法首先提取出XML数据中的语义信息,对初始的查询条件进行语义扩展,利用新的查询条件对XML数据进行查询。整个近似查询方法主要分成三部分:首先,提取XML数据中的语义信息,分别组织成OWL本体和语义树的形式。其中,本体主要描述领域内的概念和这些概念之间的关系,而语义树主要用于计算文本型元素值之间的相似度。其次,基于XML数据中提取的语义信息,提出了查询条件的语义扩展规则和近似扩展规则。这些规则对用户输入的查询条件进行松弛处理,在松弛处理的过程中首先基于IDF权重对条件进行重要程度排序,按条件的重要程度进行松弛处理,优先松弛不重要的查询条件。最后,为了保证查询满足结构方面的要求,设计了结构调整算法和结构松弛算法,对查询中出现的无效节点和错误的先序关系进行调整,并对结构方面的约束加以松弛。本文对基于语义的XML查询查询方法的查询质量和性能进行实验分析,验证了松弛算法的有效性和可行性,并与相关研究方法进行了实验对比,实验结果显示本文提出的方法能够满足查询者对文档内容的近似要求,同时在召回率和算法稳定性上也取得了较好的效果。
其他文献
管理信息系统(MIS)可提供准确、系统、全面的原始数据资源且能有效的管理这些数据。但是,随着计算机硬件及计算机应用的不断飞速发展,MIS的开发已不能适应社会的需求,随着对M
近年来,随着航天和航空遥感技术的发展,卫星遥感数据正以惊人的速度增长,如何对海量的遥感数据进行快速的处理,已经成为一个很重要的问题。现在对遥感数据的研究和应用越来越深入,由此产生的遥感算法日益复杂,这直接导致遥感图像处理时间大大增加,满足不了遥感图像的快速处理要求,并造成了大量的遥感图像的浪费。为了实现海量遥感数据的快速处理,本文设计并实现了基于P2P技术的遥感数据快速处理平台。在设计与实现遥感数
拓扑发现作为网络管理最重要的也是最优先要解决的问题得到人们的广泛关注。网络管理软件是否能够很好的发现多种网络拓扑结构成为其是否能够占领市场的一个重要衡量标准。作
以电子商务为基础的网络经济和网络财政的迅速发展,必然导致网络审计技术的出现。而在当今企业中ERP系统使用的多样化情况下,对多种具有平台异构、数据异构的企业ERP数据源的
着色是图像编辑领域中一个活跃的、有挑战性的研究课题。着色最初被定义为给黑白图像、电影或视频加上颜色的计算机辅助处理技术,实际上着色问题的研究,对于多方面的应用都具
H.264是目前国际上新一代的主流视频压缩标准,与先前的标准相比,它采用了许多新的技术以提高编码效率,应用领域更加宽广。然而,高编码效率是以提高运算的复杂度为代价的,这严
随着计算机科学技术和视频编码技术的发展,针对不同的数字视频应用,产生了很多视频编码方案和标准。而多种视频压缩标准的共存和网络的异构性导致了视频设备和网络传输出现兼
垃圾邮件已成为互联网用户的烦恼之一,已经严重干扰了人们的正常生活,浪费用户的时间、精力甚至造成了信息安全隐患。  人们已经研究了多种反垃圾邮件技术,基于规则的垃圾邮件
壁画作为人类最古老的绘画形式之一,其丰富多彩的内容,使其成为政治史、文化史等学科的重要研究资料。但由于壁画为不可移动文物,其正在因为风化、风蚀、雨蚀、褪色等病害逐
多媒体技术和数字网络通讯技术飞速发展,使得信息的发布和传输实现了数字化,但是数字媒体信息极易被仿制、处理、公开和传播,引发了数字信息传输的安全问题和数字信息的真实