【摘 要】
:
随着大数据时代的到来,传统遗留系统的响应速度已无法满足用户的需求,但其承载着大量领域知识和关键资源,简单丢弃重新开发会造成极大的资源浪费。作为一种商业计算模型,云计算具有虚拟化、资源弹性扩展、按需服务等优势,吸引着众多组织将遗留系统迁移到云平台上,以便重用遗留系统并提高大数据处理的效率。MapReduce是云计算中以并行方式处理海量数据的有效编程模型,将可并行化的遗留代码自动化地映射到MapRed
论文部分内容阅读
随着大数据时代的到来,传统遗留系统的响应速度已无法满足用户的需求,但其承载着大量领域知识和关键资源,简单丢弃重新开发会造成极大的资源浪费。作为一种商业计算模型,云计算具有虚拟化、资源弹性扩展、按需服务等优势,吸引着众多组织将遗留系统迁移到云平台上,以便重用遗留系统并提高大数据处理的效率。MapReduce是云计算中以并行方式处理海量数据的有效编程模型,将可并行化的遗留代码自动化地映射到MapReduce模型是一项有意义的工作。目前,在基于MapReduce的代码重构研究中,针对程序设计语言到MapReduce的重构研究较少,现有重构方法及工具不够成熟。为实现云移植中Java遗留代码的有效重构,本文提出了一种将特定串行代码重构到MapReduce模型的重构方法,使得重构后的MapReduce代码在处理大数据集时更加高效。本文工作主要包括以下几部分:首先,完成可重构循环的数据处理类型划分与判定。将涉及大数据处理的遗留代码按照业务逻辑划分为四种类型,利用字符串匹配算法计算抽象语法树序列间的相似度,根据得到的最大相似值判断可并行循环的数据处理类型。然后,为每种类型提出相应的重构算法以指导重构过程。重构过程包括两部分,一是通过分析可并行循环所对应的抽象语法树,判断出原循环代码中每条语句的类型,二是根据重构算法将语句重构到MapReduce代码模板的对应部分。最后,基于文中提出的重构方法开发了重构支持工具。该工具实现了可并行循环定位、抽象语法树转换、可并行代码的数据处理类型判定、遗留代码重构四项功能。实验结果表明,本文提出的重构方法有效,能够正确的将串行代码重构为MapReduce代码,而且重构后的目标代码在处理大数据集时比原串行代码更为高效。重构方法的使用有助于实现企业对遗留系统资源的重用,同时提升大数据业务的处理效率。
其他文献
所谓“动 +趋 +名”结构是指由一般动词、趋向动词和名词性成分在线性序列上连续连用的一种结构。本文主要考察三个问题 :“动 +趋 +名”结构的特点 ;“动 +趋 +名”结构中动
阮籍的《咏怀诗》和郭璞的《游仙诗》 ,前者关注人生而后者高蹈世外 ,其实咏怀和游仙只是题材有别 ,言志抒情的本质是相似的。他们都是把游仙当作排遣人生苦闷、实现理想的一
近年来,国家加大病险水库除险加固力度,在对水库进行勘察基础上,提出合理的加固方案。介绍了小型水库输水涵洞在运行过程中易出现的常见问题,并对其原因进行了分析,根据其问
农业产业是中国三大产业的基础,而其中县域农业的发展可以说是农业产业发展的关键环节。农业经济要取得高效益,需要带动农业各个环节的整合发展,挖掘农业产业发展的深度和广
<正> 新采收的玉米花粉含水量44~56%(雨后含水量增高),两年测定平均值为47.6%.由于花粉的营养十分丰富和全面,如不及时干燥将会发霉、生虫和变质,所以花粉的干燥是确保其营养
变电站综合自动化系统中,数据采集是监控系统的中心环节,所以在变电站综合自动化系统中起着重要的作用。详细分析了变电站数据采集系统,给出了系统的总体设计方案。完成了电
采用APDL建立了面向CAE的模头流道参数化模型,用分步单元划分策略和壁面滑移边界条件,完成了复杂型材熔体在模头内流动过程的三维数值模拟,获得了流道内的速度分布和压力分布
<正>宁波三生药业,一家有着国企背景,以鱼用激素起家,历经57年历练,成功完成了由国企到股份制公司,从单一鱼用激素产品到多元化的产品与解决方案的成熟企业。这正是因为宁波
<正> 《离骚》的感人之处,自然在于人物形象的鲜明,思想的光辉,而更重要的则是情感的真实。屈原以强烈的情感作为展现自己坎坷人生的纽带,因而,《离骚》具有浓厚的情感色彩,
以广东省茂名市与广西省玉林市、钦州市16个县的186户荔枝种植户实地调研数据为依据,运用Binaryregressionlogistic模型实证研究荔枝种植户采用高接换种技术影响因素,研究发现,