论文部分内容阅读
电站安全、经济运行是保证国民经济稳定发展的基础,因此,针对大型火电机组的性能监测和运行优化技术的研究具有重要意义。由于热工过程结构复杂、非线性强、运行环境多变,难以建立精确适用的数学模型,因此需要借助数据挖掘手段对热工过程中复杂多变的数据进行分析,从中获得机组运行的知识和规则,从而达到热工过程状态监测和优化的目的。本文以热工过程的实时数据采集/存储系统获得的海量历史数据和实时数据为研究对象,在对热工过程数据进行预处理后,以属性约简和聚类分析等数据挖掘方法完成电站机组目标工况库的获取和运行状态监测。本文主要内容如下:1、开展了针对热工过程的数据预处理研究,将信息熵理论结合基本统计方法作为信号变换手段,实现信号不同层次内在特征的定量表征;采用自变量与因变量相关的延时样本的多元线性回归模型实现数据清洗;利用滑动样本熵对标准化处理后的运行数据进行样本熵分析,根据设定的稳态阈值提取稳态因子从而完成热工过程数据的稳定性判定:提出ECNN算法对热工过程数据进行压缩,通过减小高稳态样本的阈值权重、增加低稳态样本的阈值权重,使得压缩集在保留原始样本集数据特性基础上保留稳态程度较高的样本。2、针对传统离散算法的离散个数需预先设定的缺点,提出一种基于熵聚类(E_Cluster)的连续属性离散化方法,该方法从数据本身的分布特性出发,无需预先设定聚类的初参数。在粗糙集互补条件熵的基础上,引入处理增量数据的更新机制,获得改进的粗糙集互补条件算法(D_RED)。利用E_Cluster和D_RED算法对锅炉的可控运行参数进行连续属性离散化和属性约简,获得不同机组负荷下影响锅炉燃烧效率和炉膛出口 NOx浓度的主要运行参数的变化情况。3、提出一种新的聚类评价指标Vnew,并将Vnew,应用到改进Kmeans算法中,通过比较每种划分的聚类有效性指标值来确定最佳分类数,实现了类心个数的自适应。基于时频域信息熵分析的特征提取方法,采用改进的Kmeans算法分析炉膛压力信号,实现信号在不同变换空间内的能量分布特性定量表征和多层次特征提取,获得了炉膛压力信号特征值和机组负荷之间的关系。4、在处理混合型数据的经典K-prototypes聚类算法基础上,结合TS_PSO优化算法对聚类目标函数不相似程度D(x,y)函数进行寻优,获得了基于TS_PSO的自适应K-prototypes聚类算法,基于该方法获得了不同负荷和低位热值相应的最佳锅炉效率和最佳炉膛出口 NOx浓度以及对应的各可控参数目标值,进而建立了反映实际锅炉实际最优运行水平的目标工况库。5、提出无需提前设定聚类初始值的EKFCM算法,通过计算Kmeans聚类过程中熵变差值,以跃迁差值达到最小值时的类别数作为FCM的初始参数,解决FCM聚类需要预先设定初始类心个数的缺点。为了避免总样本数目不断增加引起的处理难度加大的问题,在常见的FIFO增量处理策略基础上提出了 Sub-TDFO策略。将所提出的EKFCM增量聚类算法应用于热工过程数据实时监测,完成了对空预器堵灰程度和汽轮机通流部分结垢的监测。6、从系统的原理、架构和功能等方面给出了热工过程数据知识发现系统(KDTPS)的设计与开发方案及其与厂级监控信息系统(SIS)的集成方案。