分布式流处理系统中的关联容错机制研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:llqyf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机网络技术的迅猛发展以及数据获取手段的不断丰富,越来越多的领域出现了对海量,高速产生的数据进行实时处理的需求,这些数据呈现出数据量大,时效性强,数据到达速度快的特点。然而面对如此庞大的数据量,传统的处理模式已经无法在有效时间内完成,分布式流处理技术应运而生。随着大规模分布式流处理系统的计算规模逐渐扩大,故障失效成为常态。系统中由于网络,电力设备等原因导致大量计算节点同时失效的情况称为关联失效,严重的关联失效会导致系统出现长时间宕机无法恢复,因此如何保障系统能够快速从关联失效中恢复正常,保障系统的可用性成为分布式流处理系统中的关键性问题。现有的流处理系统中的容错机制分为三种:主动热备技术,每一个计算节点同时运行一个备用节点以便于失效时立即替换,成本高昂;检查点技术,周期性提取检查点,失效时回滚检查点,带来较为明显的恢复时延;上游备份技术,上游储存所有数据,失效恢复时重发,同样带来明显恢复时延。上述容错机制只针对单一节点失效的情况,无法解决关联失效由于节点数量多和节点之间存在恢复等待,导致恢复时延显著增加的问题。因此要在极短时间内迅速恢复大量节点并完成所有节点状态同步,为分布式流处理系统的容错恢复带来了极大的挑战。针对目前分布式流处理系统中存在的关联失效恢复时延长问题,构建了一个高性能容错分布式流处理系统Ares,提出一种新的任务调度方式,在任务调度过程中结合应用拓扑结构,系统可用资源,节点处理延迟,容错恢复延迟等多个因素,为每一个任务选择处理延迟以及恢复延迟最低的最佳任务调度策略,从而实现提高系统计算性能的同时提高容错能力。在Ares系统设计中,基于现有的分布式流处理系统,基于博弈论提出了一个基于best-response dynamics算法,Nirvana。理论上证明了纳什均衡的存在。通过在Apache Storm平台上进行实验和评估,结果显示与现有系统相比,Ares将吞吐提高了3.6倍,将计算延迟以及恢复延迟分别降低了50.2%和52.5%。
其他文献
半导体温度传感器具有灵敏度高,体积小,功耗低和抗干扰能力强等优点,已广泛应用于医疗,工业,航空和民用等领域。但是,大多数基于硅材料的温度传感器都不适合在高温环境中使用
由于传统杀虫剂的抗性、毒性、残留等问题,农药科学家提出今后农药研究的方向应该是对环境友好的“绿色农药”,昆虫信息素则属于这一类。本文基于“绿色农药”理念出发,以手性助剂R-,S-BOZ和手性配体R-Me-CBS诱导手性甲基,合成了两种含手性甲基侧链的昆虫性信息素:黄星天牛、松叶峰。利用ELISA测定(R,Z)-21-甲基-8-三十五碳烯和(R,Z)-21-甲基-8-三十四碳烯的黄星天牛性信息素水平
学位
本研究以猪粪为堆肥原料,通过添加不同比例的菌糠研究其对猪粪好氧堆肥过程中理化性质的影响,利用红外光谱技术对堆肥过程中有机物质结构的变化进行研究,对能够表征堆肥过程中有机物质结构变化的主要官能团进行定量和定性的分析。其次利用模糊数学综合评价法和灰色关联度分析法对堆肥腐熟度进行评价,并根据结果对比分析这两种评价方法在堆肥腐熟度评价方面应用的差异性。最后将堆肥腐熟物应用于菠菜的栽培,采用隶属函数法对菠菜
学位
牛源肠外致病性大肠杆菌(ExPEC)是一类引起肠外组织感染的致病性病原菌,可引起牛的败血症,脑膜炎,尿道感染和肺炎等疾病,并易引起继发感染或混合感染。本研究对阿拉尔某牛场疑似由大肠杆菌引起死亡的犊牛病变组织进行采样和病理观察,并通过细菌分离、形态学和生理生化鉴定及16S rRNA鉴定,确定病原为牛肺源ExPEC。通过动物试验,初步研究了该病原体的危害和病理表现。对所分离到的牛肺源ExPEC菌株进行
学位
枣(Ziziphus jujuba Mill.)为鼠李科(Rhamnaceae)枣属(Ziziphus Mill.)植物,是原产中国的特色林果,主要分布在新疆、河北、河南、山东、山西和山西6个省份。我国的枣品种丰富,但缺少综合性状优良的新品种,品种选育主要通过农家选优、实生选种和杂交育种的方式,育种周期长,难度大。本研究以枣雄性不育种质‘JMS2’(♀)?酸枣优系‘邢16’(♂)F_1代的167株
学位
立枯病是棉花苗期的主要病害,农业生产中种子包衣和叶片喷施药剂是常用的防治方法。近年来新型种衣剂及新型植物内源激素的研究逐渐崛起,其不仅对棉花苗期病害的发生具有一定防效,且对环境友好。本研究通过3种不同药剂处理棉花种子及棉苗叶片喷施,分析其对棉花苗期立枯病的防治效果及生长发育的影响,该研究为寻求新型低毒高效的防治药剂提供参考,为棉花可持续发展提供试验依据。主要结果如下:1、35%福美双·萎锈灵·噻虫
学位
自动精确分割组织学图像中的腺体在癌症诊断中起着重要作用。尽管基于神经网络的腺体分割方法效果优于传统的腺体分割方法,但是传统方法中的特征提取却能提高神经网络分割腺
随着计算机技术和互联网通信技术的飞速发展,网络带宽不断增大,计算机处理性能不断提高,计算机应用已经从各个方面改变了我们的生活,尤其是在信息的获取和使用方面。时至今日,越来越多的行业例如金融、制造、医疗、交通等等,都在使用分布式系统的架构方式来对其自身进行管理。然而这些系统往往不能互相兼容,又各自包含自身的子系统,因此对各个子系统进行科学有效的管理成为当前研究的热点。在对这些设施的维护上,实时监控发
从2004年我国第一家视频网站的建立开始,中国网络视频产业发展至今已有十余年的时间。在这十一年里,视频网站的发展经历了诞生期-调整期-发展期-成熟期四个阶段,视频网站也从
基于位置的社交网络(Location-based Social Networks,LBSN)为用户提供了许多重要的位置感知服务。兴趣点(Points of Interest,POI)推荐是其中最重要的服务之一。兴趣点推荐通过挖掘用户的签到行为,向用户推荐新的吸引人的地方。因其巨大的商业价值和应用前景,受到了学术界和工业界的广泛关注。现有的推荐算法大都是结合地理、时间、社交、内容这四个主要影响因素中