分布式数据流管理系统的负载平衡及高可用性的研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:yu0426
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在许多应用环境中,数据是以连续、可变、无界的序列形式出现,这些大量的数据有序的聚集在一起即组成了数据流。由于数据流具有实时性、连续性、瞬时性等特点,传统的数据库系统理论和技术已不能很好地对数据流进行有效的查询处理。数据流本身的特点及面向流的应用需求对数据流管理系统提出了很多挑战,人们正在研究适合于数据流的各类处理技术。 分布式数据流管理系统发展自集中式数据流管理系统之上,它的优势在于能够集合多个查询节点的查询处理能力,通过节点之间的任务调度,使其整体的查询能力远远突破单个节点查询瓶颈的限制。 本文研究了分布式数据流管理系统的负载平衡问题,发现数据流系统的瓶颈常常并非在于每个节点的有限的查询能力,而是节点之间过高的数据转移代价。它增加了系统整体的负载,降低了系统的查询速度。基于此,在网络带宽有限的情况下,本文分别研究了针对节点超载和欠载状况的负载转移策略,提出了兼顾系统整体负载和查询延时的负载平衡算法,使得在实施负载平衡后系统的整体负载和查询延时达到了较好的效果。 对于分布式数据流系统的高可用性保证,本文提出了一种以操作符作为备份和恢复粒度的高可用性算法。该算法通过对边界操作符发送的元组进行备份,对节点内操作符实施分布式的备份策略,实现了1-Safety的高可用性保证,即在系统内某时刻单个节点的错误不会影响整个系统运行,同时保证在错误发生时能够对系统实现精确的恢复。 由于分布式数据流系统中的连接操作往往成为系统运行和负载平衡的瓶颈,本文提出了对于连接操作的分割算法。该算法在保证尽量降低分割后的系统负载的前提下,将一个较“大”的连接操作分割为若干较“小”的子操作,降低了连接操作符的粒度。操作分割完毕后,系统将通过负载平衡策略,对分割后的较小的子操作所对应的操作符进行重新调度,从而使系统达到新的平衡。这种分割算法能够使分割后形成的子操作符更加灵活的被系统调度到不同的查询节点上,从而使系统整体的运行更加稳定。 同时本文设计并实现了一个分布式数据流管理系统,该系统采用管理节点.查询节点的两级模型。管理节点负责在系统运行期间进行负载平衡和高可用性的调度工作,查询节点负责运行管理节点“下发”的查询计划。整个系统模块的设计遵循了低耦合和平台无关性的基本原则,实现了易于维护和富有弹性的系统框架。该系统中使用了面相对象的设计方法,综合使用了多种设计模式,例如虚拟类工厂、Iterator等。这些技术的使用,降低了系统模块间的耦合的程度,便于系统的维护,也为后继的开发提供了较好的基础。
其他文献
电的使用为人类的生活带来了很大的改变,目前的经济发展之所以如此迅速,很大部分都是依赖于电力产业.电力企业是为社会和居民提供生活用电和生产用电的企业,关乎着社会的发展
报纸访谈类报道是新闻报道的主要形式之一,记者为获取更多的信息,提升报道的质量,在采访过程当中,应当更加注重沟通技巧的应用,采访时有许多重要信息是无法第一时间得到的,只
本文提出了一个应用于无线传感器网络的广播算法。该广播算法具有可扩展,分步式等特点。在无线传感器网络中,广播算法被频繁应用于数据查询、路由发现等操作,低能耗的广播算
传统媒体与新媒体融合是大势所趋,各个传统主流媒体正在通过各种方式走融媒体发展道路.为此,本文就当前我国传统媒体与新媒体融合困境,提出了相应的解决办法,旨在建设新型全
本文从宏观环境、企业内部以及外包服务商三方面入手对企业人力资源外包的风险进行了分析,进而提出了一些相关的防范措施.
在新时代背景下,高校机关党建工作面临着新挑战和新问题,本研究坚持目标导向和问题导向相结合,在合理定位高校机关党建工作的基础上,探索提升高校机关党建工作科学化水平的有
目的 观察使用蛇退散配合火疗疗法对带状疱疹后遗神经痛的临床疗效.方法 临床上选取带状疱疹后遗神经痛的患者120例,按照随机数字表法将患者分为对照组和观察组,对照组使用加
随着Internet的广泛应用,网络信息安全变得越来越重要,有关计算机之间通信保密技术得到越来越多的研究和应用。VPN技术利用Internet等公用通信设施,通过隧道和加密技术建立了
本文以国内成人高校思想政治教育的误区和对策为研究目标,分析阐述了当前国内成人高校思想教育存在的误区,对误区进行了着重分析,明确了成人高校实施思想政治教育的必要性,提
青少年身体素质的提升是青少年成长中的一个重要环节,并且青少年是国家后备运动员的主要力量,拥有优良的身体素质或者通过后天的体能训练和运动技巧的提升能让青少年进行体育