云平台中日志管理模块的研究与实现

来源 :电子科技大学 | 被引量 : 5次 | 上传用户:yanjinghai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着云计算的发展,现有的云计算平台都有着庞大的组织和复杂的结构。平台中各个节点和组件模块产生的日志数据巨大且分散在不同的地方,同时各个日志源独立地产生不同格式的日志数据,使得日志数据的利用率低下,无法从已有的日志数据中得出有价值的信息。这就加大了云平台开发与维护的难度。本文正是针对这样的现状和需求,围绕云平台中日志数据的管理与分析展开研究,并设计和实现了一个适用于云平台的日志管理系统。从日志的收集到日志的分析以及最后的结果展示,将日志系统划分为日志聚合模块、消息队列模块、日志分析模块以及结果展示模块。对每一个模块都进行了详细的设计和实现,其中日志聚合模块和日志分析模块是最重要的两个模块。针对云平台复杂的架构,在flume的基础上实现了一个满足高可用性、高可靠性、可扩展性以及实时性要求的分布式日志收集模块。并且在实现中针对flume的不足之处做出了相应的改动,包括功能上的改进和性能上的优化两方面。功能改进:(1)使HdfsSink能够主动创建索引,使得写入到HDFS的文件可以根据索引进行切分,从而方便进行并行数据处理;(2)实现通道切换的功能,使得各个日志采集agent发送到中心服务器的日志数据可以自动根据当前情况选择不同的通道写入,提高了吞吐量和稳定性。性能优化:(1)根据实际需求调整flume的基础参数;(2)将HdfsSink细分,提高数据写入存储的效率。日志分析模块首先提出了日志分析的两种方法,分布式调用跟踪法和基于时间滑动窗口的故障日志关联分析法。分布式调用跟踪法提供了一种构建分布式系统中请求调用链路的方法,使得分布式系统中构建特定请求的完整路径、计算特定请求耗时、计算请求中各个处理过程耗时以及分布式调试成为可能。故障日志关联分析是在现有的经典关联分析算法的基础上结合时间滑动窗口的概念形成的一种适合故障日志间关联关系分析的方法。在设计和实现中对滑动窗口的确定方法进行了改进,避免了冲突和截断这两种典型的错误。故障日志关联分析最终输出的结果是故障传播树,利用这棵树可以做到故障预测和故障定位。最后,对系统进行了多方面的测试,实验表明本文设计的日志管理系统能够适应云平台这样的大规模分布式系统,做到高吞吐、高可靠、低延时以及高效率,同时也做到了故障预测与定位,为系统管理员和运维人员提供了有价值的信息。
其他文献
【正】 党的十二届三中全会所做的《关于经济体制改革的决定》指出:“商品经济的充分发展,是社会经济发展的不可逾越的阶段,是实现我国经济现代化的必要条件。”从这个结论出
在当前的时代环境下,科学规范的进行党支部标准化建设,充分发挥党的凝聚力和创造力能更好的促进能源企业的发展和进步,更需要重点分析党支部标准化建设的重要性、党支部建设
通过分析当前SMS管理在航空公司发动机关键部件维护中的实际应用情况,总结出发动机"关键部件"的两个突出特点。根据实际一线维护管理经验提出建议:以发动机部件风险点的培训
文中就泉州市畜禽养殖废弃物资源化利用开展情况、存在的问题进行阐述与分析,并提出对策与建议。
企业慈善捐赠与财务绩效的关系是复杂多样的,通过对企业慈善捐赠与财务绩效关系的文献回顾,发现现有研究缺少对慈善捐赠影响财务绩效的作用机理的分析。本文引入企业声誉这一
<正>4月20日,国务院常务会议审议通过了关于建设双创示范基地的实施意见,这是对推动双创工作非常重要的一个文件。实施意见编制过程力求"三个坚持"李克强总理强调指出,大众创
对于全国旅游经济最为发达的地区——长江三角洲而言,慢旅游的发展已初具规模,但由于旅游业界对新兴事物未来的发展趋势了解不充分,因此有必要从生态学的视角对慢旅游活动的
"工匠精神"是对产品精益求精、追求卓越、不断创新的精神理念,它的核心在于不仅把职业当作谋生的手段,而且要对工作高度认同、敬业、敬畏和专注,并把这些品质内化于心、外化
应用领域的不断扩大推动着维生素市场的持续增长,因为竞争激烈,Roche和DSM等跨国公司进行了重组。我国企业研究出许多维生素生产新工艺,提高了产品的竞争力,开发的新工艺有两
股票市场是现代资本市场的重要组成部分。股票价格指数是衡量股市价格变动的风向标和重要的金融统计量,GDP及其年增长率是衡量宏观经济状况的常用指标。本文从实证分析的角度