【摘 要】
:
近几年来,XML已经成为Internet上数据表示、交换和存储方面的标准,为数据库的应用开辟了一个崭新的领域,然而由于XML数据的半结构化特性以及XML数据所特有的路径表达式查询方
论文部分内容阅读
近几年来,XML已经成为Internet上数据表示、交换和存储方面的标准,为数据库的应用开辟了一个崭新的领域,然而由于XML数据的半结构化特性以及XML数据所特有的路径表达式查询方式的特殊性,限制了使用关系数据库系统对XML数据的管理功能,也正是由于XML的这些特点及冗余性特点,使得不但增加了查询处理的I/O时间,同时也造成了一定的存储空间的浪费,从而降低了XML的效率,导致压缩XML成为必要的工作。但是很多压缩后的XML文档需要先解压,才能对其进行查询处理等必须的操作,并有着查询代价过大等各方面的缺点,所以如何在有效压缩XML文档的同时,保证不解压情况下进行查询处理等操作,就成为XML研究中急需解决的一个问题,使得对支持压缩的数据上直接查询处理等方面的研究工作变得十分重要。本论文分别从结构和内容两个方面研究并消除XML的冗余信息,针对已有XML压缩方法的缺点和不足之处,提出了两种可支持压缩后直接查询处理的XML压缩方法,最后给出了一种有效支持直接查询处理的XML压缩模型,并与其他已有压缩方法进行比较和分析,证明了其在一定范围内的高效性。最后,本文实现了一个符合上述XML压缩查询模型的原型系统,其中的压缩模块用的就是本文提出的XML压缩技术,并与其他压缩方法进行如压缩率、压缩时间和查询处理时间等方面的对比实验,分析了实验结果,并发现本文提出的两种XML压缩方法平衡了压缩率和查询处理时间两个方面,并能有效地支持压缩后的直接查询处理,压缩效果有一定的提高。
其他文献
软件复用被视为解决软件危机,提高软件生产效率和质量的现实可行的途径。引入软件复用来实现信用评估系统的构件化开发,可快速构建适应性好、可靠性高的信用评估系统以准确评
随着对复杂网络的深入研究,病毒营销作为新型的营销模式已经成为研究的热点。病毒营销又叫做口碑营销,主要是通过网络中的用户自发进行传播营销信息实现的。在病毒营销过程中,首
随着网络安全问题的日益严重,入侵检测系统(Intrusion Detection System,缩写:IDS)已经成为计算机与网络安全的重要组成部分。随着网络带宽的不断增加,由于处理能力的限制,现
集群技术是分布式计算的一个重要发展方向,目前,国外对它的研究非常深入,但国内还处于起步阶段。对于该领域的研究具有非常重要的意义,因为它与国家经济建设的众多部门都有密
由于Web服务的种种优越性及广阔的应用前景,自诞生之日起就受到许多机构和公司的认可与推崇,许多组织机构已将Web服务引入他们的商业流程中,并获得了直接的经济效益。然而随
数字视频是由若干帧组成的图像序列,其中含有丰富的信息。随着计算机处理能力的提高和数字图像处理技术的发展,将数字视频中的帧分解出来并加以处理和分析,从而获得必要的信息,已
汽车类型识别是智能交通的一个重要组成部分。目前,传统的电磁线圈感应识别车型法由于对路面的破坏、维护困难、不可移动性等原因,使其发展受到了有大的限制。近几年车牌识别得
无线传感器网络是由一组传感器以Ad Hoc方式构成的无线网络,其目的是协作地感知、采集和处理网络覆盖地理区域中感知对象的信息并发送给用户。无线传感器网络具有自身的特点:
本体(Ontology)是对一个特定领域中重要概念的共享的形式化的描述,由于具有明确性和共享性,它可以作为领域内不同主体之间进行交流的语义基础:更进一步的,Ontology可以帮助机
随着Internet的迅速发展和日益普及,电子文本信息迅速膨胀,如何有效地组织和管理这些信息,并快速、准确、全面地从中找到用户所需要的信息就是当前信息科学技术领域面临的一