基于非监督聚类学习的风电机组异常数据识别

来源 :华北电力大学(北京) | 被引量 : 0次 | 上传用户:daifeng216216
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,在国家大力发展清洁能源的背景下,我国的风力发电行业得以迅速发展。风电机组状态监测是保证风电场安全、高效运行的重要基础。但在实际运行中,由于风电机组的工况受到人为限电、传感器故障等影响,实测运行数据中往往存在大量的异常数据。要预先对运行数据进行异常数据识别,处理后的数据才能准确反映风电机组发电状态和性能,用于后续准确功率预测。因此,风电机组异常数据识别对进行后续工作有非常重要的意义。在电力大数据中,风电机组运行数据是重要组成部分。借助风电场的数据采集与监视控制(Supervisory Control And Data Acquisition,SCADA)系统,实现对风电机组和风电场的自动智能管理与监测。根据对SCADA系统中的运行数据分析,可以发现风电机组的运行异常并对其发电状态和性能进行评价,提高风电场管理水平和经济效益。本文以安徽某风电场的历史运行数据为研究对象,采用了基于密度的非监督聚类学习并结合聚类评价指标,实现对风电机组异常数据识别。本文的主要工作有:(1)实测运行数据中的风速和功率能够反映风电机组的运行状态和发电性能。以风电机组实际数据为例,分析了风速-功率散点图中异常数据分布特征,并总结了产生异常数据原因;介绍了非监督聚类算法类型以及各种算法的优缺点。(2)依照风速-功率散点图中异常数据分布特征,搭建基于一种基于密度噪声应用空间聚类(Density-Based Spatial Clustering of Applications with Noise,DBSCAN)算法的异常数据识别模型。由于不同工况下风电机组SCADA数据分布密度具有显著差异,DBSCAN算法无法实现全局聚类,因此模型对数据进行分功率区间处理。且由于各区间内DBSCAN算法参数选取困难,模型引入了内部评价指标监督DBSCAN两个参数Eps和MinPts的取值,指导各个功率区间的聚类结果,从而得到最佳聚类效果。实例表明,该算法模型能够对实验机组异常数据进行准确识别。(3)搭建基于点排序识别聚类结构(Ordering Points To Identify the Clustering Structure,OPTICS)算法的异常数据识别模型。与DBSCAN算法相比,OPTICS算法能够实现对高密度区域数据进行搜索并将半径参数ε放宽到一个区间范围,从而实现变密度聚类。并且OPTICS算法对参数不敏感,改善了 DBSACN算法的不足。使用OPTICS算法对风电机组风速和功率数据进行处理,根据给定参数MinPts下的决策图,确定参数ε和MinPts的取值范围,然后由Calinski-Harabasz指标监督参数取值过程,从而得到最佳聚类结果。实验表明,该算法模型对机组异常数据有很好的识别效果。
其他文献
光伏(PV)技术迅速改善了农业灌溉领域,大部分在偏远和沙漠地区;卢旺达政府的目标是从发展中国家转向以农业生产为基础的中等收入国家。卢旺达80%以上的人口以农业为生。因此,本研究项目主要侧重于卢旺达东部地区干旱气候背景下的大型太阳能智能灌溉系统的设计和建模。长期月平均每日太阳全球辐照度在5月的4.8kwh/m~2/day至7月的5.8kwh/m~2/day之间。因此,光伏地理信息系统(PVGIS)估
学位
传统汽车产业对于石油资源的依赖性较强,燃料的可替代性较低,且汽车尾气的排放造成环境状况日益恶化,故而新能源汽车以其特有优势成为汽车产业转型升级的中坚力量。动力电池作为新能源汽车重要的动力来源,成为各国产业竞争的关键。目前,在全球动力电池企业中,中国企业的地位较为突出,发展势头强劲,发展前景广阔。但在其蓬勃发展过程中,出现核心技术匮乏、研发活动滞缓、投入产出不符等问题。此外,2020年新型冠状肺炎疫
学位
报纸
目的:定量揭示甲状腺乳头状癌核内包涵体及核的几何形态结构特点,为甲状腺乳头状癌的病理诊断提供定量诊断参数。方法:取甲状腺乳头状癌100例,常规切片、HE染色,在40倍物镜下采集核内包涵体及核的图像,用ImagePro Plus测试包涵体及核的面积、周长、长轴、短轴、形状因子PE(Form PE)、形状因子AR(Form AR)、规化形状因子(RFF)、轴比、核内包涵体的面积密度以及包涵体与核质的面
期刊
近年来,我国GDP规模与人口数量不断增长,能源危机与环境污染等问题随之愈发严重,挖掘可再生能源电力潜力成为推动经济可持续发展的必然选择。在该背景下,光伏发电作为具有零排放特征的发电形式,日益受到广泛关注,光伏发电行业逐渐发展壮大,对能源电力供给侧结构优化发挥重要作用。然而,光伏发电行业在迅猛发展的同时,暴露出投资成本回收期长、资金筹集经济性低、电站建设成本高等一系列问题。随着双碳目标的提出,包括光
学位
建设生态文明关系民族未来发展,中国经历了几十年粗放式经济发展,环境问题日益突出,而企业作为社会活动的重要参与者,对环境污染问题负有不可推卸的责任。我国也相继出台了多项法律法规规范企业环保行为,而加强对企业环境行为管控是否会加重企业负担,影响企业生产投资。本文基于环境管制视角,探究加强企业环境信息披露要求是否会降低企业投资效率。选题具有一定的理论意义和现实意义。论文研究了 A+H股企业环境信息披露对
学位
大块金属玻璃(Bulk metallic glasses,BMG)内部原子表现为短程有序,长程无序的特殊排列结构,具有独特的机械、化学和物理性能,例如高的断裂强度和硬度、大的弹性延展极限、突出的耐磨性和耐腐蚀性等,从而在工业化生产应用中具有极大的潜力。但是,整体非晶合金在室温下的拉伸过程中,局部应力集中处剪切带会快速传播,导致材料在室温下的单轴拉伸塑性几乎可以被忽略。为了解决这一致命弱点,人为地向
学位
当前,电容层析成像(Electrical Capacitance Tomography,ECT)技术的成像效果尚不理想。由于现实生活中并非所有待测目标都有均匀的几何特征,因此有必要研究电极非均匀分布的ECT,以扩展该技术在不规则物体识别方面的应用。本文首先建立了三种具有不同电极排列和数量的ECT传感器模型,并分别对四种流型分布进行流型重建,以探究传感器电极排布和数量对重建图像质量的影响。通过对最终
学位
随着全球能源危机问题日益严峻和计算机、信息技术的飞速发展,智能电网应运而生。智能电网通过信息技术改造电力系统,利用智能化、数字化控制最大化能源效率并保障能源安全。然而随着电网的智能化转型,电力系统中各类终端、传感器、新型负荷数目与类型激增,接入电网的海量信息及混杂的大量冗余、噪声信息为故障处理带来了巨大挑战。因此,如何提升智能电网背景下的故障处理速度,如何高效快速选择故障关键特征,提升故障处理速度
学位
为了满足日益增长的新能源发电机组并网需求,超临界电站锅炉将承担比以往更多的调峰任务,锅炉负荷变动情况越来越多。此外,超临界锅炉蒸汽参数不断增加,导致管内蒸汽侧氧化膜问题日益突出,而且过热器负荷变化可能导致管内氧化皮的剥落,剥落的氧化皮容易堆积在弯头处,也会导致超温爆管。本文采用CFD方法结合有限体积模型,研究超临界锅炉高温过热器在不同负荷和氧化膜剥落并堆积于弯头处的管壁温度变化情况,并预测管壁超温
学位