基于部分求值和热踪编译的Twig查询优化方法

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:yoursbin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于互联网技术的快速发展,我们可以通过它来发布和获取各式各样的信息。所以,为了充分且有效地表示网络上丰富的数据,W3C组织提出了将XML作为互联网上信息共享的格式。XML由于具有半结构化描述特性和很容易被扩展等特点,目前被广泛地用在互联网上数据的描述与交换,并逐渐作为事实上的标准。为此,高效的XML数据查询成为使用XML的必然要求。为了对XML数据的查询与处理等操作进行标准化,W3C组织提出了一种标准的XML数据查询语言——XQuery。其最核心的操作是Twig查询,又被称为树模式查询。所以,设计一种高效的Twig查询算法已经成为研究的热点。经过了几年对Twig查询的研究,已经出现了一些比较常见的Twig查询算法,如:基于结构连接的MPMGJN算法、基于整体匹配的TwigStack算法及其衍生算法Twig2Stack、避免层次栈这种复杂数据结构的TwigList算法、进一步减少中间结果产生的TreeMatch算法等。其中,TreeMatch算法由于极大程度上减少了中间结果的产生,被认为是最好的Twig查询算法之一。然而,在TreeMatch算法的核心操作getNext中,存在不少仅依赖Twig查询模式的计算。当getNext调用次数很多时,这种冗余的重复计算会严重影响TreeMatch算法的性能。为了进一步改进TreeMatch算法,提高TreeMatch算法对XML数据的查询性能,本文提出了一种基于部分求值和热踪编译的Twig查询优化方法,该方法以Twig查询模式作为不变量进行部分求值,把查询请求翻译成一种Twig查询机指令序列,避免了查询过程中对Twig查询模式的重复计算;并且针对这种查询机指令序列的解释过程,利用热踪编译技术进行了优化,以提高查询机指令序列的执行效率。对比试验说明基于部分求值和热踪编译的优化方法能够将Twig查询效率提高了20%到60%。
其他文献
随着我国空间科学的迅猛发展,空间天文观测揭开了我国探索空间科学现象的新篇章。天文观测任务规划是天文观测的前提,如何针对空间科学探测的多种模式进行任务规划,满足多种模式
近几年来,智能移动终端和新一代移动网络的普及给视频应用提供了广阔的空间。但是,相对于日渐庞大的视频业务需求,网络资源是极其有限的。为此,学术界和产业界投入了大量的精力进
全过程游戏自动生成技术是中国科学院陆汝钤院士提出的一个构想,希望能够通过自然语言创建脚本,通过游戏脚本,添加游戏的元素最终生成一个游戏。基于游戏引擎的3D手机动画自动生
该文简要介绍了双波段红外火焰探测系统的主要设计依据,阐述了其基本工作原理,介绍了系统中与软件设计相关的硬件组成,尤其是双波段红外火焰探测器的硬件设计,并给出了控制器
关于安全博弈的研究近年来广受重视,许多基于安全博弈论的系统已在现实世界中得到了成功应用。在该研究的理论框架中,博弈双方为安保部门和不法分子。其中安保部门首先确定一种
本文的工作是为北京大学软件工程研究所正在研发的基于Erlang OTP(OpenTelecom Platform)的虚拟计算平台UniAS提供处理大文件数据的能力,设计并实现了大文件并发处理模块。本
随着网络规模的扩大和复杂性的增加,人们对集成系统和网络管理体系结构的要求越来越高.如何进行有效的网络管理,保证网络的良好运行已成为一个迫切需要解决的问题.目前的大多
三维编织技术是国外八十年代初发展起来的一种新型纺织技术.主要的两种编织方法:二步法和四步法.以往的三维编织多采用四步法进行,在这方面的织物结构研究和计算机辅助设计已
所谓“眼见为实”,通过观察一幅图像,人们可以对事物的外观信息和由其呈现出的事物性质得以直观和真切地把握。由于量子计算机的性能较之经典计算机有着本质的飞跃,以及量子计算
当前,回答集程序设计已经成为人工智能领域知识表示和推理的重要工具。它是一种描述性的问题解决框架,非常适用于对涉及常识推理的问题进行建模,并自动求解。动态逻辑程序是回答