数据流管理系统Argus中并行处理机制的设计与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:pisces_ww
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术在金融、交通、军事、生态监测、网络监测等领域的深入应用,需要计算机处理的数据类型和数据量与日俱增。作为一种新的数据类型,数据流在近些年得到了计算机界的广泛关注。由于连续、无界、顺序、时变的特点,数据流上的查询处理和数据管理与传统的数据库管理系统有很大不同。我们北京大学数据库实验室也在国内率先自主开发了集中式的数据流管理系统 Argus。 本文主要研究现有的集中式数据流系统在面临海量查询时计算能力有限情况下的查询处理问题,即协同多个计算单元来构造并行数据流系统。 本文首先提出并行流系统的体系结构,并给出运行模式。然后全文重点讨论了并行流系统中采取的并行策略,主要是查询间并行和查询内并行两个层面。关于查询间并行,问题主要是多查询共享,我们分别考虑相同算子和相似算子的情形:对相同的算子,要采取最恰当的共享执行顺序;至于相似的算子,我们针对选择算子和窗口算子这两类最重要的算子分别给出共享算子模式的算法。关于查询内并行,我们考查划分数据流和划分查询这两种策略并分别给出算法。然后我们针对典型的并行处理策略给出一系列验证性实验。文章最后对未来的研究工作做了展望。
其他文献
随着计算机图形学技术在现实生活中的普及,计算机图形学的研究领域越来越广泛。近些年,越来越多的大规模三维网格数据在各应用领域,如电子商务、医疗、科学计算可视化、工程分析
学位
在可预见的将来,视频播放类业务在用户驻地网上仍将占据主导地位。这类业务对音视频的同步非常敏感,为了保证播放质量,引入流整形技术,在网络出入口处理数据的时间戳信息,因此系统
学位
学位
低轨卫星网络已应用于语音和窄带数据业务,与同步卫星网络的设计相比,低轨卫星网络更加复杂,但是低轨卫星网络让小型地面终端通过卫星通讯成为可能,并提供了更小的传输延时及频率
学位
运行在Windows操作系统平台上的程序或者应用软件,其性能常常因为某些无法预料的瓶颈而受到干扰,导致程序的处理效率降低,性能上得不到充分的发挥。而Windows操作系统在其运行过
本文对面向轻量级应用的开源WebGIS内核的设计与实现进行了探讨。本研究结合WebGIS的应用特点,基于Java技术设计实现了一个面向轻量级应用的开源WebGIS内核——PKGML2。在PKGM
本文依托国家自然科学基金项目(项目号:40202030),着重从矿产资源预测结果数据的三维重构方面入手,利用计算机图形学的相关算法,借鉴医学、游戏软件制作等领域中已经成熟了的可视
随着互联网的发展和网民数量的增加,网上电子商务市场也在不断扩大。伴随着电子商务的发展,网上的产品评论也越来越多。商家和网民都希望能有高效而准确的工具来处理这些产品评
最近几年,移动设备正逐步地取代传统计算设备,在人们日常生活中扮演着愈加重要的角色。伴随着移动设备的快速增长,保证移动设备上应用的质量成为一个急需解决的问题。因此,针
本文主要关注的问题是如何正确理解网页内容的真实语义并按语义之间的联系度量网页间的相关度。针对这一问题,作者提出了一种新型的信息检索模型,该模型的理论和应用包括:1)构建