论文部分内容阅读
近年来,随着互联网、物联网、传感器等信息技术与通信技术的迅猛发展,数据量的急速增长成了许多行业共同面对的严峻挑战和宝贵机遇。而工业中信息技术的进步和现代化管理理念的发展与普及,企业的运营越来越依赖信息技术。在现阶段的工业中,已经存储了海量的设备工况数据,呈现出了大数据的诸多特征,但是绝大部分企业并没有挖掘出这些数据应有的价值。现在先进的信息通信技术不断地融入工业设备中并不断更新,推动工业设备向自动化、数字化、智能化方向发展。中国政府更是基于以上发展趋势提出了“工业大数据”的概念。具体而言,在设备、生产线中配备各种传感器,抓取数据,然后通过无线通信连接互联网,传输、存储数据,对设备运行或生产过程进行点对点的实时状态监控。在设备运行过程中,外部环境或者意外事件会使设备的性能发生一定的变化,会出现故障。现在可通过传感技术感知数据,通过对设备运行过程中的各个因素精确感知并利用统计学习的知识来实现设备的故障诊断。为了充分利用工业中海量数据并且保证诊断的准确性和高效性,本文将基于数据驱动的方法,运用统计学习模型,对风机叶片结冰情况进行预测。本文在对风机运行状态数据划分不同时间窗的基础上,运用模型LightGBM、XGBoost、ERT模型进行嵌套融合,得到混合模型,缩小可疑故障数据的范围,保证较为准确的情况下基本覆盖到几乎全部的故障数据,并在再次细分的时间窗下得到更好的效果。本文先对模型LightGBM进行介绍,叙述LightGBM和XGBoost的联系,结合业务背景介绍特征工程,并基于不同的时间窗,运用LightGBM、XGBoost和ERT模型,逐步缩小可疑故障数据的范围,进行训练和测试,并对这模型进行对比研究,提高风机叶片结冰预测的准确性。