论文部分内容阅读
随着网络化和信息化的发展,以及大数据的盛行,硬盘故障将对数据中心产生越来越大的影响,所以对硬盘剩余寿命进行预测显得尤为重要。硬盘剩余寿命预测能有效降低数据丢失率,有效弥补因硬盘故障带来的各种损失。本文把XGBoost算法引入到硬盘故障预测中,分别在大样本和小样本下与决策树、随机森林、GBDT算法进行对比实验,得到XGBoost模型对硬盘故障的预测效果最好,有助于XGBoost算法在硬盘故障预测中的推广应用。