Hadoop数据分析平台性能监控与分析

来源 :北京邮电大学 | 被引量 : 3次 | 上传用户:dflhe88
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网产业的迅猛发展,“大数据”时代已然到来。Hadoop凭借其高容错性、高可靠性、高扩展性、高效性、低成本和简单等优势在海量数据处理方面大放异彩。但是随着Hadoop集群规模的不断扩大、使用人员的不断增加,集群的运维工作越来越复杂,运维人员需要对其性能进行实时的监控分析以保障集群高性能地运转。本文首先对Hadoop集群监控指标和监控技术进行了概述,然后根据集群运维人员的需求设计并实现了 Hadoop数据分析平台性能监控系统,该系统能帮助集群运维人员实时了解集群状态、各组件运行状况及各服务器节点资源使用情况,从而及时处理集群故障,保障集群正常运转。接着本文经过对HDFS数据分布和访问信息的采集与分析,发现实验室集群HDFS数据分布存在不均衡现象,且各个DataNode上数据的访问与DataNode性能资源消耗趋势保持一致。因此本文提出了 HDFS数据分布优化策略,研究了数据分布对HDFS数据访问和作业运行的影响,最后通过实验得出以下结论:balancer程序能优化HDFS的数据分布,实现数据的分布均衡,数据分布越均衡,用户的文件访问时间和作业运行时间越短。随着并发访问文件的用户数和并发作业数的增加,数据分布对文件访问时间和作业运行时间的影响越来越大。
其他文献
酒精性肝损害的研究中发现,乙醇及其代谢产物(乙醛、NADH等)可作用于多种细胞(枯否细胞、单核细胞、血小板、肝窦内皮细胞等),使静止的肝星状细胞(hepatic stellate cells,HS
作者论述了情报科学与情报学的区别和情报学的研究范畴,对侍报主体的交流特征和情报功能的局部空间理论进行了探索。
文章通过计算对比,说明过期期刊用缩微片存储在经济上的合理性。作者认为,应利用高密度存储的缩微技术来提高书库的存储效宰,辟建议配合中文科技资料数据库建立缩微全文库。
目的:探讨心脏骤停患者心肺复苏成功相关因素,进一步提高急诊心肺复苏成功率.方法:随机抽取近年来急诊科心脏骤停患者 72例进行分组对比分析,甲组 38例为心肺复苏成功,乙组 3
旅游业是国民经济和现代服务业的重要组成部分,加快推动全域旅游发展,是贯彻落实“绿水青山就是金山银山”理念、“共抓大保护、不搞大开发”导向、“生态优先、绿色发展”方针
报纸
随着我国经济的不断增长,公路建设行业因其行业特殊性得到了较快的发展,其中发展最为快速的是建设工程项目,但在快速的发展中,也暴露出了很多问题,比如对基础信息的保管不足,
目的:探讨小切口下全髋关节置换术的方法和手术效果.方法:采用小切口下全髋关节置换术,临床应用 12例 15髋,股骨颈骨折 7例 7髋,股骨头缺血性坏死 5例 8髋.其中骨水泥型 8髋,
<正> 考察近几年计算机技术的发展,有两个方面特别引人注目。第一是个人计算机。它以其低廉的价格可能把情报检索网络引入家庭和办公室。另方面,作为一个强有力的或智能的终