论文部分内容阅读
基于最优组方差算法的风电SCADA定子温度数据清洗研究,主要通过风电场SCADA系统对其风机机组的运行状态进行发电机的运行参数采集,由数据处理工具将定子温度相关的参数存储至数据库。由于SCADA数据分析过程低效、模型精度不高以及经济效益不足的问题,需要对其数据源进行清洗与优化等数据预处理的研究,使得数据源的质量和精度有明显的提升。在数据预处理的清洗算法使用与研究期间,结合神经网络基本原理,进行不断研究,主要工作如下:(1)SCADA数据前期处理研究。回顾了 SCADA系统的结构以及其作为数据源的作用。SCADA数据前期处理工具进行数据源到研究中所需要的前期准备工作,该工具是为了方便数据前期的使用便利性自主独立开发的数据软件。并着重讲解了该数据处理软件的设计框架,界面生成脚本及软件使用说明等,为本文定子温度的研究提供了研究保障与平台。(2)数据清洗算法的使用与探究。为了提高定子模型精度,定子温度的相关参数的数据源的质量高低起到了绝对性的作用,通过分析风电SCADA系统采集的各部件数据,对于其中发电机的定子温度,优化数据处理与分析的过程,这里提到了两种数据预处理的清洗算法,拟合曲线阈值法以及领域临近。这两个算法主要根据通过最标准数据点,前者拟合出标准曲线,后者以标准点为圆心划圆领域,区分两种数据集。(3)最优组方差算法研究。结合常规数据清洗算法需要依赖标准数据点的明显不足,提出了这种算法,该算法主要是通过滑差值得到较为理想的阈值,并在整体的数据集中进行阈值划分,一处为非正常,一处为正常,而正常部分的数据集便是后期需要建模的数据源。该算法主要特点是在数据预处理过程中不需要依赖标准数据点,相比常规的两种算法,无需寻找标准点便可直接使用。(4)改进OIV算法的研究。将原OIV算法的算式结构进行了一定的改进。由原本的单阈值划分改为双阈值的限定,改进最优组内方差算法其核心点便是其双阈值的使用。通过实例分析表明改进后的最优组方差算法可行且高效,能够准确处理发电机定子温度曲线数据并通过使用神经网络进行预测,显著提高了风电机组中发电机定子温度预测的准确性,最后与拟合曲线阈值法、领域临近法、原最优组方差算法进行比较,在模型的精度上得到了进一步的提升。