XQuery并行实现中任务调度方法的研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:sheygy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的普及应用,XML以其半结构化、自描述等特征已经逐渐成为网络上数据描述和数据交换的标准,并且在越来越多的领域得到应用。同时,XML不断增大的数据量给XML数据查询带来了更大的挑战。2007年,W3C(World Wide Web Consortium)发布了作为XML数据查询与处理规范的XQuery语言以适应XML查询处理领域的新变化。针对XML半结构化和XQuery函数式语言的特点,如何提高XQuery语言的处理性能已经成为学术界XML数据查询和处理研究的热点。近年来,研究人员从不同角度提出了很多方法来提高XQuery语言的处理性能。例如,利用XML查询代数、树模式匹配算法和动态编译技术等。另一方面,随着并行技术的发展,利用多核环境提供的计算能力结合多线程技术提高XQuery的处理性能,已经成为提高XQuery语言性能的重要研究方向之一。而在XQuery语言并行实现相关研究中,针对XQuery程序整体查询,研究XQuery语言内在并行性,将查询计划中的任务合理地调度到各个工作线程或处理单元,减少程序的整体执行时间,又是提高XQuery语言性能的另外一种重要途径。本文针对XQuery自动并行化过程中的任务调度问题,提出了一种适用于共享内存多线程环境下的调度方案。该方案利用存在于XQuery语言中的三种内在并行性,结合一种新型的任务调度算法、并行方式选择策略以及负载均衡算法,提高了XQuery并行处理的性能。同时,针对流水线并行方式,本文从流水线任务不同工作状态角度出发,利用流水线节拍之间的空闲等待时间,建立了一种流水线局部并行自动机模型,通过流水线任务工作状态的迁移,提高了资源的利用率。通过对上述方案的实现及测试,验证了本文提出的XQuery并行处理方案能够提高XQuery的处理性能以及系统资源利用率的正确性和有效性。
其他文献