论文部分内容阅读
火力发电是我国目前重要的发电方式,在我国的能源结构中具有重要的地位。近年来,随着国家对于节能减排的要求越来越严格,必须对燃煤机组的运行状态进行准确的建模和优化。然而,尽管有着大量的机理性的研究工作,燃煤机组由于其工艺复杂性、规模巨大性、运行工况多样性和燃煤品质多变性导致其精确建模异常复杂。燃煤发电在历史运行中已经积累了大量的覆盖电厂生产全过程的运行数据,这些数据为大数据技术在燃煤电站中的应用和发展提供了数据支持。因此,数据驱动的建模技术已经在参数预测、故障诊断、安全监测、性能优化方面也得到越来越多的应用。目前数据驱动的火电建模工作尚主要集中于在机理模型指导下利用系统少量的监控参数进行的建模,很少考虑高维、变时滞时序数据建模的特殊需求,这使得模型精度很难在各复杂工况下保持较高水平。同时,对于时滞研究的缺乏使得模型的透明性差,在实际系统中的部署也会遇到模型可解释性问题。本文针对火电机组的高维时序工业大数据,构建了一种基于数据驱动的针对火电机组大数据高维性和时序性的数据驱动建模方法,以期提高火电机组热力系统的建模效率和建模精度。本文选取火电机组中火电厂方感兴趣的且具代表性的参数为例,运用本文提出的数据驱动反向建模方法,分别建立了主汽温度、再热汽温、输出功率等的预测模型。主要研究内容如下:1)针对火电机组工业大数据的高维性,本文设计和实现了一种Filter与Embedded方法相结合的快速评估特征重要性的特征选择方法,通过基于统计的相关性分析并结合梯度提升机模型训练得出的权重,筛选出与建模目标高相关的重要特征,避免了纯粹基于机理模型只考虑数据间因果关系导致建模参数的选择少,而忽略数据间存在的高价值的相关关系,以致于较难寻找系统次要影响因素的问题。2)针对火电机组工业大数据的时序性及工业大数据中各相关特征与预测目标之间复杂的时滞关系,本文创新性的提出了一种基于一阶时序相关性的算法TD-CORT来计算特征间的时延大小,通过该算法能够准确判断特征与预测目标的时延先后。对于特征的时延判断,可以看作是一种在时间维度上的特征选择方法。精确的时序特征工程可以使得机组模型的建模在保持较低计算复杂度的情况下同时提升模型准确度。3)针对机组工况的复杂性,本文从特征预处理、特征选择到融合模型的训练,在保证模型精度的情况下极大地减少了手动调参的过程,并创新性的提出了基于LightGBM与深度神经网络的Ensembling模型融合方案。在复杂工况下实现了对目标特征较好的预测精度,同时保证了模型的泛化性。本工作已在TensorFlow机器学习系统套件上实现,在基于Docker容器的Rancher平台上实现了部署。实现的系统预测模型已被部署在了国内某1000MW超超临界火电机组上,用于对火电系统多个关键参数进行建模和预测。场地测试以及长达十个月的持续化服务表明,该算法在火电机组的各个工况下均能保持较高的预测精度,已经为电厂的实际操作调度提供了有效的指导。根据本文数据驱动的建模方案所建模型的精度验证了本文建模方法的可行性,为火电机组建模提供了新途径。