基于Hadoop的测试系统Soak的任务管理和数据分析模块的设计与实现

被引量 : 0次 | 上传用户:yy19880904
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今,大数据平台Hadoop相关的技术发展很快,与此同时,Hadoop平台相关组件(如MapReduce,HBase等)的性能测试需求日益增加。CDH是目前最流行的Hadoop发行版,由Cloudera公司定期发布,而Intel公司刚刚投资了Cloudera公司。为了尽早地发现并解决CDH在真实的多用户、多应用操作场景下可能出现的性能问题,Intel的大数据部门设计并研发了Soak测试工具。如何调度执行仿真的多种用户操作任务,并在此基础上收集运行时数据进行分析是Soak需要解决的重要问题。本论文设计并实现了任务管理模块和数据分析模块解决了Soak项目中存在的上述问题。任务管理模块主要关注模拟仿真任务的调度与执行。Hadoop平台下用户的真实操作,存在分布式执行、多应用操作、多用户操作以及用户数随着时间变化等特点。为此,Soak系统需要采用主从式架构。主节点负责分配任务,多个从节点执行任务。每个从节点都可以同时执行多种应用、多个用户的任务操作,通过这种方式来模拟用户在Hadoop平台上的真实操作。数据分析模块关注任务运行时相关数据的收集和分析,以此来发现Hadoop平台可能存在的性能问题。一类是应用本身的问题,例如并发情况下应用执行出错或者执行时间过长;另一类是应用执行过成中节点出现的性能问题,例如随着用户数目均匀变化,节点的CPU性能却出现抖动变化。因此,数据分析模块需要收集两类数据,首先是统计应用执行的时间、失败次数等,然后是收集应用执行的过程中,节点相应的CPU、IO等性能参数。对于收集到的数据,需要计算每个时间段内数据的最值、均值等。数据分析模块采用了统一的数据存储格式和分析算子来实现数据分析。Soak设计了虚拟用户的概念模拟多用户操作,并使用多线程管理调度,从而达到性能测试的要求。同时,Soak使用了Akka实现主从节点间的消息通信,并使用Dispatcher的方式处理消息。另外,项目中还使用Ganglia和JRRD来收集系统性能数据以及Spring, Gauva等其它框架和技术。
其他文献
通式为Ba(B’1/3B"2/3)O3的复合钙钛矿陶瓷是重要的微波介质材料,作为谐振器和滤波器的关键材料,在微波通信技术中发挥着重要的作用。本学位论文通过烧结助剂、B位离子置换、
<正>佛教沿中西商贸要道"丝绸之路"传入中国,敦煌作为西部佛教文化中心,在1600多年的历史中将宗教、文化和艺术融为一体,彰显了独特的美学价值。佛像背光指佛像头后或背后的
通过分析金融行业会计运作过程中面临的风险隐患,研究其产生的原因,以有效地避免金融会计风险的发生。
自去年六月份以来,一批以余额宝为代表的互联网金融产品纷纷涌现出来,这些线上理财产品因其高收益,低门槛,操作便捷等优点,受到广大民众的欢迎,但是这些互联网金融产品的潜在
9β,11β-环氧-17α,21-二羟基-16β-甲基孕-1,4-二烯-3,20-二酮(Ⅳ)是生产9-氟甾体激素的关键前体,以9β,11β-环氧-17α,21-二羟基-16β-甲基孕-4-烯-3,20-二酮-21-醋酸酯(Ⅰ)
介绍浅海地区的纳潮河特大桥大直径深桩基的施工过程。施工中采取冲击钻与正循环钻机组合成孔的施工方法,解决了上硬下软地质特点的成孔难题;冲击钻冲孔后安装临时长钢护筒并
湿法磷酸生产中 ,均以水为介质冲洗倾覆盘式真空过滤机的滤盘 ,为实现系统的污水零排放 ,提高倾覆盘式真空过滤机的生产能力 ,提出以回磷酸和硫酸配制成混酸去冲洗滤盘的方法
目的探讨亚砷酸对慢性白血病患者的影响。方法选择我院2004年1月至2010年5月采用亚砷酸注射液进行治疗的慢性粒细胞白血病患者18例,对其临床资料进行回顾性分析。结果 18例患
<正>数学知识是一个相互有联系的结构体.学生从每节课中获取的数学知识是零散的、局部的、不便于记忆的.这些知识在整个知识体系中的地位如何?局部知识与其它知识的区别与联
本文遵循绩效管理的一般原理和方法,从绩效计划、绩效实施、绩效考核和绩效反馈等方面探讨如何加强对高校财务人员的绩效管理。