不平衡数据集下基于自适应加权Bagging-GBDT算法的磁盘故障预测模型

来源 :微电子学与计算机 | 被引量 : 0次 | 上传用户:moon818882003
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对磁盘数据集中正负样本数目严重不平衡导致基于机器学习的分类算法易出现故障预测准确率低的问题,本文提出一种基于自适应加权Bagging-GBDT算法的磁盘故障预测模型.首先,提出基于聚类的分层欠采样方法对健康磁盘样本进行多次抽样,解决随机欠采样方法易丢弃潜在有用样本的问题;其次,将每次采样后样本与全部故障磁盘样本组合得到多个样本子集,通过训练这些子集建立多个预测精度较高的GBDT子分类模型;最后,根据待测点邻域样本类别自适应确定各子模型权重,据此通过加权硬投票集成最终的磁盘故障预测模型.在8组KEEL不平衡数据集上实验结果表明,与现有典型不平衡学习算法相比,少数类的召回率平均提升了9.46%;同时在磁盘公开数据集和某调度系统磁盘数据上对比验证了该方法在故障预测率上的先进性.
其他文献
在目前煤炭企业安全发展所面临非常困难的新时期、新阶段,各级工会干部肩负着光荣而艰巨的历史使命,尤其是基层一线的广大工会干部尤为重要。企业基层工会干部的形象与素质,直接
社区卫生是作为城市医疗卫生服务体系中的基础环节,越来越受到各级政府和社会的关注。凸显公益性是此轮社区卫生服务改革及国家新医改的核心目标,而以公益性为目标的新型社区卫
近年来,学校安全事故时有发生、意外伤害、食物中毒、暴力犯罪事件、学生自杀事件等一系列事件,严重威胁师生安全以及社会稳定与和谐。因此,进行危机管理,为学生营造安全的学习环
学位
在新课程标准背景下,初中历史要在尊重学生学习主体地位的前提下,教师要让学生在学习生活中找到历史学习兴趣点,并以此介入课堂互动教学,提高课堂教学效率,推动学生知识学习与兴趣
课堂提问是启发式教学的重要手段,也是调动学生学习语文积极性的一种有效的方法。在教学中,课堂提问是一个必不可少的环节,它是传递教与学信息的形式之一。所以说,搞好课堂提问对
在班级管理中,教师不仅要关心成绩好的学生,更要重视后进生的学习情况,通过深入了解和分析后进生思想状况,采取合适的教学方法转化后进生,使这些后进生在教师的关心和爱护下对学习
在全球化背景下,中国经济飞速发展,但大学生就业缺口与就业市场手工劳动者严重匮乏的局面形成鲜明对比,职业教育迫在眉睫。本文以职业教育过程中学生所应该掌握的翻译技能进行初
在我国高等教育除了本科一批、二批、三批层次教育之外,还包括了高职教育。在高职院校,主要培养的是技术型高职学生。对高职生进行教育过程中,不但需要重视理论、实践教育,还需要
我国是一个各类自然灾害频发的国家,随着生产力的提高,工业化、城市化和现代化水平的不断提高,经济的繁荣和利益的分化与私利的凸显,我国的灾害类型也“与时俱进”地进行着历