【摘 要】
:
海量数据的爆发式增长,对存储设备的容量、性能和可靠性提出了新的要求。机械硬盘作为现代存储系统的重要存储设备,易发生机械故障导致数据损坏与丢失的事故。因此,高效监测磁盘状态并及时预警故障,有利于建立高可用的存储系统。现有研究建立的磁盘故障预测系统通常有磁盘生命周期量化简单、应用场景特殊或上线成本高的局限性,不适用于通用场景。当前基于深度学习(Deep Learning,DL)技术能智能精简地预测磁盘
论文部分内容阅读
海量数据的爆发式增长,对存储设备的容量、性能和可靠性提出了新的要求。机械硬盘作为现代存储系统的重要存储设备,易发生机械故障导致数据损坏与丢失的事故。因此,高效监测磁盘状态并及时预警故障,有利于建立高可用的存储系统。现有研究建立的磁盘故障预测系统通常有磁盘生命周期量化简单、应用场景特殊或上线成本高的局限性,不适用于通用场景。当前基于深度学习(Deep Learning,DL)技术能智能精简地预测磁盘健康程度,为系统化监测磁盘状态提供了重要解决思路。针对如何高效精准地预测磁盘故障的问题,提出一个在线磁盘状态监测系统(Online Hard Disk Monitoring System,OHDMS),该系统能够在线监控并预测磁盘健康状态。具体地,系统将磁盘生命周期的预测划分为两个阶段,分别涵盖磁盘全部和剩余24天的使用寿命,一级预测阶段作用于磁盘整个生命周期,将生命周期以24天的倍数为粒度划分为5个阶段进行预测。当监测磁盘寿命只剩余24天时,以4天的倍数为粒度划分为3个阶段,由二级预测阶段精确预测其剩余寿命。预测模型的选择从主流的DL模型中对比产生,基于故障检测率、误报率和模型预测精度等系数评估最佳线上使用模型。另外,OHDMS采用离线训练与在线训练结合的方式,在线下离线训练的基础上,在线上实时采集磁盘数据流用于对DL模型的再训练,既能基于共享参数的迁移方式迁移到小样本磁盘模型,又能微调旧模型,防止模型老化,保证性能稳定。在真实的服务器环境中,实现了OHDMS的系统原型。对不同DL模型的磁盘健康状态预测性能进行了对比,并基于线上采集的数据流对模型进行更新与迁移。测试结果表明,两个预测阶段分别采用CNN-LSTM模型和深度LSTM模型可以精确预测磁盘的生命周期,实现92%-97%的检测率和2%-4%的误报率,并且线上学习过程中,更新模型比旧模型提升了近一倍的预测准确率,迁移的模型精度达到86%以上。
其他文献
在天线的设计与研发流程中,天线测量技术是仿真验证后所有后续处理的基础,无法使用其他方法替代该步骤。常见的近场测量方法是利用探头天线在待测天线的近场区获取球面、平面、柱面扫描面上的离散辐射场数据,基于模式展开定理做近远场变换计算出天线的远场特性。对于应用环境复杂,难以构成球、平、柱扫描面的天线,利用上述测量技术进行测量,不仅会增加测试的工作量,而且会提高近远场变换的难度。本文针对扫描面为任意曲面时模
现有雷达系统多采用载频、编码形式、重复周期、脉宽/带宽均不变的经典工作模式,该工作模式在简单场景下具有性能高、计算量小等优势,但在复杂电磁环境下,特别是强对抗电磁环境下,具有规律性强、易被侦察截获和干扰等不足。日益复杂的电磁环境给雷达发射波形优化和接收处理提出了新的挑战。针对这个问题,本文从时间和频谱两个维度,开展复杂调制波形优化方法研究,主要工作内容如下:1.针对发射波形对雷达探测性能和干扰抑制
无线传感器网络(Wireless Sensor Works,WSN)和物联网的飞速发展使得微小型传感器的规模迅速扩大。目前,这些器件主要依靠电池供电,但电池储能有限,需定期维护,推高了各种传感器网络的使用成本。环境振动能收集技术为解决这一问题提供一个潜在地解决方案。然而,环境中的振动能普遍具有频率低的特点,其收集利用难度高。对于俘能器而言,机械振动可分为加速度激励(俘能器与振动源固定)和位移激励(
随着大数据时代的发展,分布式内存系统已经被广泛应用来提供高性能的服务,由新型非易失性存储器设计实现的分布异构内存系统可进一步提供更好的性能。通过在本地客户端增加缓存,可以减少对远端服务器的访问,从而减小分布式系统的延迟来提高性能。然而加入客户端缓存会引发分布式系统中的缓存一致性问题,当多客户端共享同一远端数据时,需要保证本地缓存副本的数据与远端存储对象的数据是一致的。但在分布式系统中实现缓存一致性
现阶段毫米波雷达凭借自身优势成为汽车驾驶应用的关键传感器,同时又因汽车雷达工作环境复杂多变,导致噪声或干扰混入回波信号,所得目标探测参数就会存在误差。而目标跟踪滤波目的在于抑制噪声带来的影响,为更准确地估计目标状态,目标跟踪是必不可少的。本文以车载毫米波雷达为背景,研究毫米波雷达的目标跟踪算法,并基于TDA3x硬件平台提出实现毫米波雷达目标跟踪的方案。首先介绍毫米波雷达的基本原理,包括毫米波雷达的
当前的大规模存储系统广泛使用纠删码技术,它以条带的形式存储数据实现容错,使得在满足相同容错的情况下,比副本容错技术拥有更低的存储成本。为进一步降低存储成本,学术界和工业界开始研发“大条带纠删码(Wide-Stripe Erasure Coding)”技术,通过增加大条带的长度来压缩校验块在每个条带中的比例,从而节省更多存储成本。然而,大条带纠删码由于条带过长而导致校验块的编码计算量大、编码效率低,
硬盘的可靠性很大程度上决定了存储系统的可靠性,如何在硬盘发生故障前进行预警成为研究热点。硬盘一般通过自我监测、分析和报告技术(Self-Monitoring Analysis and Reporting Technology,S.M.A.R.T.)系统采集每天的运行数据,根据监测属性值的变化进行预警,但该方法预测硬盘故障的成功率较低。目前主流研究方法将硬盘故障预警问题看作是时序数据分类或预测问题,
以通讯、导航、探测、计算机、雷达为代表的电子装备结构复杂,研制周期短,更新换代快,品种多批量小,可靠性要求高。在电子装备设计、制造、检测、运维的全生命周期各阶段,都需要具备对装备的加工、装配、使用、维修、保养和故障排除的能力,而直观、精准、可交互的产品技术手册是实现这一目标的关键所在。传统的技术手册存在制作效率低、可交互性差、不直观、查询检索困难低等问题,无法满足电子装备定制化、数字化、集成化的发
随着人工智能、物联网等技术不断的升级和应用普及,全球数据呈爆发式增长。大量的数据频繁在处理器和存储器之间交换和处理,这种信息存储单元和计算单元分离的计算架构,严重的制约了处理器的计算性能。忆阻器因其良好的非易失性存储和逻辑计算功能、高速、低功耗、可与CMOS工艺兼容等特点,成为最重要的存算一体化器件之一。然而忆阻器导电通路形状和通断部位的随机性导致器件的一致性较差,严重的限制其产业化应用。因此,导
长期以来,考试都是一种有效的学情评价手段,但在传统的手工阅卷和现代的网上阅卷过程中,存在教师阅卷工作量繁重,对学生的学情评价只能依赖教师手工进行等问题,为教师增添了额外的工作量。在“双减”的背景下,如何在切实减负的同时有效提升教学质量,对教师的教学工作提出了更高的要求,要求教师对学生的学习情况有更加精准的认知,从而展开针对性的教学,真正达到因材施教的目的。通过对考试及学情评价全过程的分析,结合人工