面向超级计算机的自适应故障预测算法研究

被引量 : 0次 | 上传用户:juejiang12
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展,云计算等大型分布式系统开始广泛投入部署和应用。然而随着应用系统软硬件复杂性的增加,如何保证系统能够长时间正确运行,为广大用户提供高质量服务,成为了大型系统设计开发过程中需要考虑的问题。大型系统如果能够通过故障预测策略实现自我诊断,那么其容错能力和资源调度能力就能得到很大的提升,从而保证系统的高可用性和高可靠性。超级计算机拥有复杂的计算机系统,针对超级计算机的故障预测研究对于提高超级计算机的运算性能和系统容错能力具有重要意义,并且有效的故障预测策略也可以应用于其它大型系统中,以此提高这些系统的容错能力。本文以超级计算机的系统运行日志为基础,首先设计并实现了基于语义和时间相关的过滤算法(Semantic Time Filter Algorithm,简记STF),对日志记录进行预处理。STF算法考虑日志记录之间的语义相关度和时间相关度,根据两个相关度对原始日志记录中的冗余记录进行过滤。通过实验发现,过滤后的日志记录序列能够有效地反映系统中非故障事件到故障事件的演变过程,对于后续分析并建立故障预测模型有很大帮助。通过对过滤后的日志记录进行分析,本文运用数据挖掘中的分类预测思想,将时间轴划分为一定大小的时间窗,针对时间窗进行特征提取,以时间窗为单位进行故障预测。本文使用AdaBoost算法在SVM分类器的训练学习过程中,根据训练集动态调整分类器核心参数,使分类器进行自适应学习提升,建立了自适应故障预测模型AdaBoostSVM。本文以超级计算机BlueGene/L215天的系统运行日志为实验数据集,经过预处理后,在该数据集上进行预测模型的对比实验。实验结果表明:本文的AdaBoostSVM模型较基于故障记录之间时间间隔(Time Between Failure TBF)、基于kNN、RIPPER以及SVM的故障预测模型具有更好的分类预测性能,特别是在故障预测中的重要指标召回率方面,自适应故障预测模型AdaBoostSVM的召回率要高出其它预测模型10%-20%。
其他文献
网络社交工具发展至今,微信等应用软件由于其移动性等特点成为了受众新宠,迅速在手机用户中流行起来,已突破2.7亿用户,①庞大的用户群让其备受瞩目,不少商家纷纷看中了其商业
利用山东省348户苹果种植户实地调查数据,本文试图考察交易成本对农户垂直协作方式选择的影响。研究表明:苹果种植户垂直协作方式包括现货市场、销售合同和合作社三种类型,并
随着城市建设的不断加快,各项基础设施的建设也在不断改善。遵义市经济发展迅速,而这对遵义市的城市建设提出了更高的要求。基于此,本身首先介绍遵义市中心城区黄线现状,然后
桥梁是交通生命线系统的重要枢纽工程,其抗震安全问题一直是学术界和工程界的关注焦点。对于地质条件复杂、空间跨度大的长大桥梁,地震动行波效应和土—结构相互作用(SSI)效应是
随着全球经济的发展,船舶市场持续升温,造船企业发展迅速,但同时船舶业的竞争也日益加剧。造船是一个会产生巨大物流成本的复杂生产过程,在企业通过压缩生产成本、扩大销售额来赢
本文主要从人口红利、资本存量和全要素增长率等方面入手,基于新古典增长方程,对我国经济在"新常态"时期的合理增速目标进行了测算。结合我国实际,本文综合考虑了(1)政治层面
<正> 我县1983年试用鸡粪喂猪。1988年1月提出推广应用鸡粪“三合一”猪饲料喂猪(即鸡粪、配料、青饲料)和养适量母猪(即每提供100头商品猪养5~7头母猪)的“两配套”科学方法
<正>时光匆匆,2014年即将过去。回望这一年,互联网行业有欢笑也有泪水,有兴奋也有惋惜。这一年,大家努力、拼搏,抓住机会、找到出路,热闹、浮沉、纷乱中,时光如白驹过隙。但
海外版权引进成为我国电视产业最稳妥的做法,助益于电视品牌联想。当务之急是培育本土原创机制,尤其是:选择适合引进的海外节目模式、扩大引进节目的门类、以差异化战略瞄准
随着我国经济的不断发展,生活水平的不断提高,必然要求人们的知识文化水平紧跟经济社会发展的步伐。大学扩招为此提供了可行的解决办法,然而,大学扩招所带来的每年应届毕业生的人