面向多样性需求的并行计算模型研究与开发

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:dwj854
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息产业,特别是互联网的迅速发展,数据信息的产生已经进入爆炸式增长模式。如何高效的处理这些海量的数据,已经成为众多公司企业机构越来越关心的问题。本文详细介绍了当前海量数据处理的主流并行计算模型—MapReduce及其相关技术,并且对当前处理迭代计算的并行计算模型进行了详细的分析,总结了他们的优劣。同时,在此基础上设计实现了一种新的并行计算模型——泛MapReduce模型。泛MR模型是MapReduce模型的泛化版本,它可以做任何MapReduce可以做的工作。但该模型在任务迭代计算、流程动态控制方面对MapReduce的模型进行了改进。在任务迭代方面,改进了原系统需要在作业级进行迭代的缺点,新模型可以在一个作业内进行任务级的迭代计算,同时用户可以方便的利用系统接口定义迭代终止的条件——设置迭代次数或者比较前后两次迭代产生数据的差值等。这极大减少了作业级迭代时磁盘的I/O、网络中数据的传输量以及冗余任务阶段,同时,方便了对迭代的控制。在流程动态控制方面,用户可以在一个作业内定义若干个任务阶段,若干个流程分支,只要在分支的任务处定义好流程改变的条件,在作业执行时流程就可以按照用户所定义的条件自动改变流程。泛MR相对于MapReduce在迭代易用性、效率方面有明显提升。本文在集群环境下对泛MR的新功能设计了多个测试用例,其中包含一些具有代表性海量数据迭代计算的测试用例。本文对这些测试用例进行了详细描述,并且给出了重要的原始测试数据。从这些测试数据中可以看出,泛MR系统在进行迭代计算的时候,相对于MapReduce模型效率有明显提升。
其他文献
有机硅防污涂层因其无毒环保的特性,具有重要的应用前景。但有机硅涂层强度较低,当船舶运行时易破损剥落,使得有机硅防污涂层的应用受到了一定的限制。为此,本文开展了对纳米
由于蜘蛛抱蛋属植物花小、花期短、伏地易被掩盖难采集且变异较大,其分类鉴定很困难,迄今为止没有较为满意的分类系统,虽然现在多辅以细胞分类学、微形态学、孢粉学及DNA条形
沙拐枣(Calligonum mongolicum)作为蓼科灌木,具有生长快、抗风蚀、耐沙埋、耐旱、易繁殖的特点,是干旱半干旱荒漠地区重要的防风固沙先锋种和优势种,因此研究沙拐枣种群繁殖特征对荒漠绿洲过渡带的种群自然更新、生态恢复与治理技术具有重要作用。我国荒漠绿洲过渡带天然固沙植被如何利用有限的资源实现种群稳定和扩张一直是干旱区生态环境建设亟待解决的科学问题。本文以河西走廊荒漠绿洲过渡带(临泽内
生物质高效转化制化学品是近年来的研究热点。葡萄糖和木糖是自然界比较丰富的单糖,它们的高值化利用对于发展绿色循环经济具有重要意义。但目前,葡萄糖和木糖的下游产品比较
河川径流变化影响着一个流域社会经济的发展,对径流变化的研究一直是水文学家备受关注的问题,目前的研究主要有两个方面:其一是定量分析气候变化和人类活动对径流变化的贡献
煤炭自燃是煤炭开采过程中的主要灾害之一,为了防治煤自燃,国内外相继开发了多种防灭火技术,其中凝胶作为一种新型防灭火材料近些年来开始受到重视。然而目前防治煤自燃的凝
花椒籽废渣是花椒和花椒籽加工的废弃物,主要成分为木质素、纤维素等,是制备活性炭的良好原料。本文以花椒籽废渣为原料,利用化学活化法制备活性炭并研究了其对有机染料和重
表面增强拉曼光谱(SERS)自1974年被发现以来因其具有极高的检测灵敏度而被广泛应用于食品安全、电化学、生物医学等诸多领域。SERS是一种能够与单分子荧光技术相媲美的技术,但
目的:目前的研究发现胚胎期阿片暴露对围生儿的生长发育、大脑结构、大脑功能有广泛影响。应激显著影响生物体的生长发育和大脑的功能,但其对胚胎期吗啡暴露大鼠的影响尚不清
商业信用融资作为一种非正规融资渠道,对推动我国经济的高速发展起着不可替代的作用。尤其是在我国的正规金融体制尚不完善,银行等正规金融机构普遍存在信贷歧视的情况下,商