数据中心Hadoop部署与追踪系统研究

被引量 : 0次 | 上传用户:maowang300miao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
MapReduce框架和其开源实现Hadoop自从问世以来,受到了学术界和工业界的广泛关注和使用。但是开发一个高效的MapReduce应用通常需要大量的MapReduce集群使用经验甚至需要理解MapReduce模型的底层工作机理。另外,快速建立一个可用的MapReduce集群环境也是用户比较关心的一个话题。因此,快速部署MapReduce集群环境、并实时展示MapReduce的工作流程是更好理解、应用甚至完善MapReduce模型过程中必须要研究的重要课题。Hadoop部署与追踪系统HDTS(Hadoop Deploy and Tracing System),旨在提供先部署MapReduce集群环境然后对MapReduce作业进行追踪的一体化解决方案。其中部署子系统提供了一种不需要用户接触机器便能快速部署、配置Hadoop集群环境的一种解决方案;而追踪子系统提供了一种在Hadoop集群环境部署成功后,实时展示MapReduce工作流程的解决方案。部署子系统向用户提供友好的用户界面,使用户在几个步骤之内轻松完成大规模Hadoop集群的配置、分发、启动等工作;追踪子系统基于对Hadoop源码工程的深刻理解,通过在源码中插入追踪代码,使得用户可以在追踪客户端直观感受、并且参与到MapReduce作业的运行。追踪子系统通过一种观察点的机制来保证追踪子系统实时地、精确地向用户提供追踪信息。追踪子系统使用自己修改过的追踪内核,用户在装配了这个新的内核之后,其所有接下来的操作与平时操作无异,多个用户能在任何装有追踪子系统客户端的节点上同时开启追踪客户端。因此,HDTS系统让用户在不接触物理机器的前提下,完成了对Hadoop集群的部署和追踪,为用户提供了完善的功能和良好的使用体验。Hadoop部署子系统前端采用Ext Ajax Framework,后端使用Python CGI管理Linux机器;Hadoop追踪子系统基于Hadoop源码工程,采用Java语言作为追踪代码实现和客户端实现。功能测试表明,部署子系统正确完成了Hadoop的配置、分发、启动工作;追踪子系统正确完成了各个观察点的展示。性能测试表明,追踪子系统对系统造成时间开销不超过4%。
其他文献
在现代法治国家的大背景下,政府行政管理涉及到越来越多的领域,行政自由裁量权也大量出现,这在行政处罚领域表现得成为地突出。行政处罚裁量权的存在虽然保证了行政行为的灵
数字时代的到来,使城市规划设计、建筑设计和风景园林设计都发生了革命性的变化。计算机辅助设计已经深入到了设计过程的始终。计算机辅助设计给设计师带来了无穷想象力,同时
国内建筑业信息化长期落后于西方发达国家,也落后于国内其它行业。许多事务所仍然停滞在手绘概念图、2D CAAD做方案,3D CAAD出效果图的阶段。改变粗放型的发展模式,实现“质
在某些电机应用场合,例如航空航天、汽车动力、军事、车床加工等领域,由于其在体积、质量、环境适应性、可靠性等方面的特殊要求,以及某些特殊的负载间歇突变工况,常规设计的
高频雷达工作频率为3-30MHz,通过利用电离层对电磁波的反射效应或长电磁波在地球表面的绕射效应,实现超视距探测。与微波雷达相比其角度、距离分辨率较低。为了提高系统分辨
3G通信中,通常使用效率较低的线性功放做最终信号放大,这影响到手机电池的使用时间。通过研究放大器的基本原理发现,适当调节放大器供电电压和偏置电流来调整工作点的位置,达
近年来我国城市化进程加速发展,在点源污染治理不断完善的情况下,由城市地表径流对地表沉积物的击溅、冲刷等作用而引起的非点源污染对水体环境的影响正日益突显,成为水体污
医院是一个人员流动大,易感人员多的场所,而手术室又是其中极为特殊的区域。手术部的洁净与否直接关系着手术的成功率和病人的康复效果。然而在能源紧张的今天,如何在提高洁
短语动词是国内外英语语言学和英语教学研究的重要领域,近年来国外一些学者利用语料库考察实际应用中短语动词的使用情况,如不同文体短语动词的覆盖率及活跃性排名等,而二语翻译
随着社会经济的不断发展,电力成为人们日常生活中必不可少的一种能源,对社会的发展也起着非常重要的作用。继电保护装置是电力系统中的重要组成部分,对电网的运行状态有着很