基于领域知识的多元时间序列异常预测方法研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:yhmlivefor46
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息科技与传感技术的发展,制造业朝着制造无人化、制造智能化方向快速发展。在制造业设备的生产与运行环境中,掌握设备运行状况是非常重要的。当前,制造业设备的运行状况被样式丰富的传感器从多方面进行实时监控,这些传感设备每天都会产生海量的数据信息,研究人员可以通过数据分析等方式对设备的状态进行评估,实现设备的信息化管控。制造业不仅需要对设备出现的异常运行状况进行准确的检测,还需要对设备未来可能发生的异常状况进行提前预警。特别地,如果能够根据当前设备的运行数据推测出设备未来的运行状态,相关人员便可以对设备未来可能出现的异常情况提前做好相应的准备,避免重大经济损失和人身安全事故。因此,对于制造业而言,根据设备的历史运行状况推测未来该设备是否会发生异常至关重要。当前,在根据历史数据推测未来是否发生异常的时间序列异常预测的研究中,这些方法主要通过循环神经网络及其变体对时间序列数据进行预测,然后根据预测值与实际观测值之间的偏差或者预测值是否超出正常值范围来推断未来是否会发生异常。而少数方法则是对预测值进行重建表示,然后根据重建误差推断未来是否发生异常。这些方法基本是仅依赖于数据信息的深度学习方法,通过海量的数据与重复训练来获得良好的预测效果。然而,面对具有丰富领域知识,且时间层面的变化规律非常复杂的多元时间序列数据,以往的异常预测方法很难取得良好的效果。本文以制造业移动设备为背景,专门针对具有丰富领域知识的多元时间序列异常预测问题展开研究,利用领域知识来提高深度学习模型对多元时间序列数据特征间关系的表示能力,该研究面临以下挑战:一是领域知识往往是理论模型,且与设备的实际状态存在差异,如何获取更加符合实际情况的领域知识?二是领域知识其形式通常是复杂多样的,如何有效地将领域知识与深度学习模型有效并深入地结合?三是在实际应用环境中经常会出现正常数据与异常数据均稀缺的情况,这导致难以直接有效地训练深度学习模型,如何在数据稀缺条件下对具有丰富领域知识与复杂时变特性的时间序列数据进行有效地异常预测?为了解决上述挑战,本文进行了以下两方面工作。其一,本文提出了一种领域知识嵌入的多元时间序列异常预测模型(Multivariate Time Series Anomaly Prediction based on Domain Knowledge,MTAP-DK),预测时间序列数据在未来一段时间内是否出现异常。该模型首先通过历史时序数据对领域知识进行提取与修正,以获取更加符合实际情况的领域公式。然后,将获取的领域公式与深度学习方法相结合,增强模型对特征间复杂影响关系的表示,以提高预测效果。其二,本文提出了一种领域知识与迁移学习结合的异常预测模型(Transfer Learning for Multivariate Time Series Anomaly Prediction through Domain Knowledge,TransMTAP),在数据稀缺条件下预测未来一段时间内是否出现异常。该模型将领域知识与迁移学习相结合,提高模型对具有丰富领域知识与复杂时变特性的多元时间序列数据的迁移能力,并据此解决数据稀缺带来的问题。本文的主要工作及贡献概括为以下三点:1.针对于数据充足条件下的异常预测任务,本文提出了 MTAP-DK模型,解决了具有丰富领域知识与复杂时变特性的多元时间序列数据,在未来一段时间是否出现异常的预测问题。MTAP-DK模型首先基于设备的历史运行数据对领域知识进行优化与修正,以提取出更加符合实际情况的领域公式。然后,将提取出的领域公式与深度学习模型有效地结合,对深度学习模型在知识层面进行指导与约束,增强模型对具有丰富领域知识的多元时间序列特征间关系的表示,并据此实现有效的异常预测。2.针对于数据稀缺条件下的异常预测任务,本文提出了 TransMTAP模型,解决了在数据不足条件下,具有复杂特性的多元时间序列数据是否在未来一段时间出现异常的预测问题。TransMTAP模型首先集成多种相似计算方法来筛选源域数据,并将领域知识作为目标域与源域之间数据迁移的桥梁,有效地将源域数据迁移至目标域,以解决数据稀少带来的深度学习模型难以训练与优化的问题。然后,使用特征预测器来预测未来的数据模式,使用特征领域判别器来判别数据的所属域。最后,通过迁移模块与判别器、判别器与预测器之间的对抗来优化模型,以达到良好的异常预测效果。3.本文在两个真实数据集上进行了大量实验,验证了 MTAP-DK模型和TransMTAP模型的有效性。实验结果显示MTAP-DK和TransMTAP模型能够分别在数据充足与数据稀缺条件下实现有效地异常预测,并与现有基线方法进行效果对比,本文提出的模型在多个评价指标上均有提升。同时,为了验证模型中各模块的有效性,本文进行了充足的消融实验,经对实验结果的对比和分析,这两个模型中的各模块都能够对模型的效果有较好的提升。
其他文献
当前我国即将进入人口负增长阶段,其中既有人口年龄结构的因素,也有育龄妇女生育意愿降低的因素。对于因人口负增长所导致的人口规模下降不需过度担心,但应该关注和应对低出生率对未来人口老龄化的影响。应对人口老龄化不宜采用直接刺激生育意愿的政策,而应该采用以提高人口质量为中心的人口长期均衡发展战略,将政策重点放在提高人口质量上,尤其是提高儿童成长质量上,由此实现人口质量对数量的替代。以人口质量提升为重点的人
脊髓性肌萎缩是一种常染色体隐性遗传的罕见神经肌肉系统疾病,其特征表现是进行性肌无力和肌萎缩。随着神经科学的发展,许多研究不断丰富对其诊治的认知,对未来攻克此类罕见疾病提供了科学技术基础。现就脊髓性肌萎缩临床认识、治疗进展进行综述。
近年来,随着社会经济的飞速发展,市场的竞争日趋激烈,给企业带来了新的机遇和挑战。在激烈的市场竞争中,企业只有通过强化财务、建立和完善的风险管理体系,才能提高企业的整体竞争力,从而促进企业的持续健康发展。本文从企业财务管理的角度,论述了加强财务风险控制的重要性,并对目前财务会计风险的预防和控制提出了一些建议。
现代企业管理要求财务管理要适应企业高质量发展,既能服务业务,防控风险,又要支持决策,满足企业发展战略,更要创造价值。现代企业财务管理应该不断创新管理理念和管理方法,加强业财融合,有效控制成本,防范财务风险,助力企业取得良好的经济效益和社会效益,为企业稳定快速发展奠定坚实基础。
美国斯坦福、日本筑波、韩国大德等国际知名科学城在建设和发展过程中形成了完善的创新政策体系,在人才引进、产城融合、普惠性财税政策等方面的成功经验值得中国科学城借鉴参考。基于国内外对比分析的视角,通过对美国斯坦福、日本筑波、丹麦哥本哈根等世界典型科学城的政策梳理分析,总结归纳了国际科学城推动创新发展的主要政策经验,并结合中国科学城规划布局的现实情况,探讨了国际科学城建设政策经验对中国持续推动科学城发展
目的 了解长沙市居民健康素养与吸烟、饮酒、身体活动3种常见健康相关行为分布特征,探索健康素养与健康相关行为的关系。方法 采用多阶段随机抽样方法,2020年9月至12月长沙市对15~69岁常住居民开展现况调查。结果 实际调查4 701人,吸烟者构成比为25.40%,经常饮酒者构成比为17.17%,缺乏身体活动者构成比为58.05%;同时没有吸烟、经常饮酒、缺乏身体活动3种健康危险行为的调查对象构成比
随着数字化的持续发展,各行各业都积累了大量的数据,对这些数据的有效利用可以带来价值,其中时间序列作为数据的一种表现形式而广泛存在,如企业为了提供稳定服务或者安全原因而监控和收集的各种性能指标数据。时间序列异常检测作为数据序列分析的一个任务也得到了大量关注,如企业智能化运维系统能力中就包含异常检测这一关键组成部分,并且随着深度学习技术的发展,更多的数据加上更强大的模型,都为时间序列异常检测带来了更好
目的:探讨精确性呼吸系统指标管理在胸外科患者围术期护理中的应用价值。方法:将本院90例接受胸外科手术患者按照入院先后顺序随机分为观察组与对照组,每组45例;对照组给予常规胸外科手术患者围术期护理,观察组给予精确性呼吸系统指标管理护理;对两组患者的呼吸机耐受率、机械通气时间、ICU入住时间和肺功能水平差异等指标进行比较分析。结果:两组患者入院时肺功能水平无明显差异(P>0.05);治疗期间观察组患者
目的 观察胸外科术后患者接受综合护理干预对排痰效果和肺部感染问题产生的临床影响。方法 对厦门市某三甲医院在2020年1月至2021年1月期间接受胸外科治疗的80例患者进行研究,按照随机分组原则将患者分为对照组和研究组,两组患者组间例数均为40例,其中,对照组患者接受常规护理,研究组患者在常规护理的同时增加综合护理干预,对两组患者在不同护理方案中的排痰效果和肺部感染情况进行研究,并详细比较两组患者生
现代科技迅速发展,工业系统日趋复杂,智能传感器的广泛使用,使得工业过程产生与存储大量复杂的时间序列数据,这些数据呈现多维、耦合、非线性与强因果等特性,因此对于工业过程时间序列数据的挖掘与分析成为热点研究。工业生产系统要求运行过程稳定与高效,如何分析与解决出现的故障,是关键性问题之一。工业系统故障分析包含异常检测与根因分析,异常检测要求对关注的时间序列对象进行及时准确地异常判断,根因分析要求对工业故