面向XML数据语义检索关键技术研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:yinxuchao1123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的迅猛发展,人们可以通过互联网不断地从世界各地交换信息,同时,XML也成为了网络上各种应用程序交换异构数据的新兴标准。面对大量XML。数据的涌现,XML数据检索表现出了越来越大的研究价值。与传统的HTML检索不同的是XML检索返回结果是XML文档片段,而HTML检索返回结果是整个HTML网页。近年来,许多基于XML数据树模型的检索算法被相继提出,这些检索算法普遍存在的问题是人们仅仅从XML数据本身的结构特点去研究,没有从语义的角度去考虑检索问题,从而导致了查询返回结果无法充分满足用户的查询需求。   本文提出了基于语义关联空间的XML检索算法和基于最大重复语义单元的检索算法来解决这个问题,本文的研究内容和研究特色如下:   (1)在自然语言理解中,由于表达方式的差异,导致存在一词多义、同义、近义、歧义等现象,因此字符串匹配不等同于语义匹配。针对此现象,本文提出了语义关联空间的概念和相应的XML检索算法,以提高查询算法的性能和检索效果。   (2)通过大量的研究和观察,我们发现大多数的XML数据文件含有大量的重复结构,体现了这些用来描述实体的重复结构在语义上具有一定的完整性和相似性。针对此现象,提出了最大重复语义单元的概念和相应的XML检索算法,以使查询算法返回结果粒度大小适中的XML文档片段。   本文提供了大量基于真实数据和人工数据的实验结果都证明了基于语义关联空间的XML检索算法和基于最大重复语义单元XML检索算法在查询性能方面与当前其他检索算法相比具有明显的优越性。
其他文献
随着计算机图形学和计算机视觉的快速发展,高级图像编辑技术近些年来发展非常迅速,越来越多的研究开始关注对图像内容的理解,如图像模型的材质和表面结构信息。本文提供了一
在我国互联网产业快速发展的今天,互联网+在社会实体经济中的需求地位日益增长,对我国各个产业的发展有着重大影响。随着国家各项政策的发布,粮食产业一直未能真正打破传统的流
随着绿色计算的提出,越来越多的研究者开始关注绿色网络通信,努力营造绿色节能的网络环境,Ad hoc网络作为一个专用网络,其节能需求也越来越得到广泛重视与发展。由于Ad hoc网
21世纪是信息时代,而且网络在日常生活中越来越常见。为了满足更多的需求,无线网络应运而生。但是由于无线网络的特点,使得网络中的能量是一个非常重要的资源。因此,为了节省
植物是组成自然景观的重要部分,由于其形态结构复杂,种类繁多,对其进行计算机建模已成为图形学研究的重要领域。植物的生态生理模型可以应用在农林业的研究中,形态模型可以应
狙击手定位是现代信息化战争当中一个重要的研究课题,在战场上定位出狙击手位置并做出及时反击对保障士兵安全有重要意义。   根据狙击枪打枪时发生的物理特性,狙击手定位
密码学是保障信息安全的核心技术,应用涉及军事、国防、商贸及人们日常生活的各个方面,分组密码以其高效率、低开销、易于实现等特点在现代密码学中占据重要地位。由于加密算
随着微处理器内部设计的复杂度越来越高,在芯片级和板级测试中,软件模拟、软件监控和软件分析等调试手段已经远远不能满足功能正确性调试和故障准确定位等要求,所以微处理器
在复杂网络分析中,社区发现是该领域的重要课题。如何快速有效地将复杂网络中的社区挖掘出来呈现给数据的使用者越来越受到研究者的重视。本文基于谱图理论中的代数连通性函数
随着信息化时代的到来,各行各业已经离不开计算机软件,但现如今的软件产品不能满足人们对于高质量的软件的需求,如何高效的设计与开发出高质量的软件产品是当今学者研究的课