热工过程海量数据挖掘技术研究与应用

来源 :东南大学 | 被引量 : 12次 | 上传用户:DirtySnow
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
电站安全、经济运行是保证国民经济稳定发展的基础,因此,针对大型火电机组的性能监测和运行优化技术的研究具有重要意义。由于热工过程结构复杂、非线性强、运行环境多变,难以建立精确适用的数学模型,因此需要借助数据挖掘手段对热工过程中复杂多变的数据进行分析,从中获得机组运行的知识和规则,从而达到热工过程状态监测和优化的目的。本文以热工过程的实时数据采集/存储系统获得的海量历史数据和实时数据为研究对象,在对热工过程数据进行预处理后,以属性约简和聚类分析等数据挖掘方法完成电站机组目标工况库的获取和运行状态监测。本文主要内容如下:1、开展了针对热工过程的数据预处理研究,将信息熵理论结合基本统计方法作为信号变换手段,实现信号不同层次内在特征的定量表征;采用自变量与因变量相关的延时样本的多元线性回归模型实现数据清洗;利用滑动样本熵对标准化处理后的运行数据进行样本熵分析,根据设定的稳态阈值提取稳态因子从而完成热工过程数据的稳定性判定:提出ECNN算法对热工过程数据进行压缩,通过减小高稳态样本的阈值权重、增加低稳态样本的阈值权重,使得压缩集在保留原始样本集数据特性基础上保留稳态程度较高的样本。2、针对传统离散算法的离散个数需预先设定的缺点,提出一种基于熵聚类(E_Cluster)的连续属性离散化方法,该方法从数据本身的分布特性出发,无需预先设定聚类的初参数。在粗糙集互补条件熵的基础上,引入处理增量数据的更新机制,获得改进的粗糙集互补条件算法(D_RED)。利用E_Cluster和D_RED算法对锅炉的可控运行参数进行连续属性离散化和属性约简,获得不同机组负荷下影响锅炉燃烧效率和炉膛出口 NOx浓度的主要运行参数的变化情况。3、提出一种新的聚类评价指标Vnew,并将Vnew,应用到改进Kmeans算法中,通过比较每种划分的聚类有效性指标值来确定最佳分类数,实现了类心个数的自适应。基于时频域信息熵分析的特征提取方法,采用改进的Kmeans算法分析炉膛压力信号,实现信号在不同变换空间内的能量分布特性定量表征和多层次特征提取,获得了炉膛压力信号特征值和机组负荷之间的关系。4、在处理混合型数据的经典K-prototypes聚类算法基础上,结合TS_PSO优化算法对聚类目标函数不相似程度D(x,y)函数进行寻优,获得了基于TS_PSO的自适应K-prototypes聚类算法,基于该方法获得了不同负荷和低位热值相应的最佳锅炉效率和最佳炉膛出口 NOx浓度以及对应的各可控参数目标值,进而建立了反映实际锅炉实际最优运行水平的目标工况库。5、提出无需提前设定聚类初始值的EKFCM算法,通过计算Kmeans聚类过程中熵变差值,以跃迁差值达到最小值时的类别数作为FCM的初始参数,解决FCM聚类需要预先设定初始类心个数的缺点。为了避免总样本数目不断增加引起的处理难度加大的问题,在常见的FIFO增量处理策略基础上提出了 Sub-TDFO策略。将所提出的EKFCM增量聚类算法应用于热工过程数据实时监测,完成了对空预器堵灰程度和汽轮机通流部分结垢的监测。6、从系统的原理、架构和功能等方面给出了热工过程数据知识发现系统(KDTPS)的设计与开发方案及其与厂级监控信息系统(SIS)的集成方案。
其他文献
想刚刚好以42.195公里的距离跑完马拉松?别想了。马拉松的标准长度是42.195公里,但当我们跑完马拉松,看自己或别人GPS表记录的轨迹,最终显示距离都会多出好几百米,甚至还有超
清真词的叙事艺术主要是通过悬想、用典、留白等方法来表现的。首先,悬想的运用,使得故事时空交叉跳接,聚焦对象反复转换,而又有条不紊,交错有致,予人一种立体感;其次,用典不
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
朱彝尊的《静志居琴趣》虽被学术界认为是一本艳情词集,话题敏感,但还是有许多问题值得探讨。该集珍藏了词人美好的回忆,是其创作生涯的转变。朱彝尊本着儒家传统的词学观,从
慢性非特异性溃疡性结肠炎是一种主要侵及直肠、结肠黏膜层,常形成糜烂、溃疡,以腹痛、腹泻、脓血便为主要症状的大肠炎症性疾病。2005—08--2008—08,我们运用自拟三七阿胶汤保
应用文献综述的研究方法,从理论的角度讨论了如何结合实际,选择民族传统体育项目进入中学体育校本课程。结果表明:在选择时应考虑传统体育项目要与时俱进、发扬地区特色、遵
针对高校图书馆占座现象严重、座位资源利用率低下等问题,设计一套智能化的图书馆座位服务系统。该系统以无线局域网为媒介,利用信息采集与识别系统感知座位的使用情况,借助
生理药动学(physiologically based pharmacokinetic,PBPK)模型是一种基于生理机制的模型,能够模拟药物在体内的吸收、分布、代谢和排泄过程。近年来广泛应用于药物-药物相互
近几年来,随着我国环保工作的大力发展和人们的生态保护意识不断增强,生态环境得到明显改善,与此同时,鸟类的繁衍和活动更加频繁,这极大地威胁到架空输电线路的稳定运行。文章针对