论文部分内容阅读
随着大数据时代的到来,海量数据的存储逐渐由客户端转移到了云端并存储在企业数据中心里,一旦数据中心发生故障,将会给企业带来巨大的损失。而如今现代数据中心的数据存储依旧以磁盘存储占主导地位,因此磁盘故障的维护是如今运维人员的主要工作之一。如何高效的利用现有资源根据磁盘数据对未来可能发生的磁盘故障进行预测,并及时备份数据更换磁盘来提高现代数据中心存储系统的可靠性已成为数据中心的研究热点之一。然而,当前数据中心磁盘故障预测研究中仍存在着不足之处,目前主要采用的磁盘故障预测建模方法均是以分类问题进行处理,只能预测出磁盘未来是否会发生故障,而且当前磁盘故障预测问题的研究精度也不够高,同时磁盘故障预测模型的有效预测时间也比较短,运维和相关工作人员无法及时根据磁盘预测的结果将磁盘进行备份和处理。针对上述问题,本文提出一种磁盘故障预测模型,该模型分为基于卷积神经网络的磁盘故障检测模型和融合LSTM神经网络和fbprophet算法的SMART数据预测模型,该模型可以准确预测出未来30天的磁盘故障情况。主要内容如下:(1)磁盘故障检测模型利用卷积神经网络具有分别计算、利用局部处理数据、权值共享,使其可以在输入数据保持高维度的同时自动有效的提取出数据有用特征并进行计算,最终达到分类目的的特点。利用多个卷积层和池化层对磁盘信息进行特征提取,得到能够检测出磁盘是否故障与当前磁盘信息之间的关系,从而检测出当前磁盘是否存在故障的结果。(2)SMART数据预测模型利用LSTM神经网络解决长时间依赖问题与fbprophet算法对时间序列数据周期性和节假日特点拟合效果较好的特点,将两个模型融合来提高磁盘SMART数据的预测精度。将模型融合的SMART数据预测模型输出结果输入到磁盘故障检测模型中,建立能确定未来具体发生故障时间的磁盘故障预测模型。实验证明该模型可以准确预测出磁盘未来30天的故障信息。本文工作为未来磁盘故障预测系统的设计和实现提供了一定参考。