论文部分内容阅读
摘要:从运行工况方面来说,风电机组较为复杂多变,其监测数据也呈现出,多元复杂以及增长迅速等特点,现有的异常预测方法已经不能对其进行快速处理,同时需经度也不能得到保障,这要求我们必须在结合实际的基础上对其进行合理的改革与创新,也就是说针对设备状态信息所进行的异常预测工作必须实现对科学性的保障,通过相关实验结果进行分析后可以发现该种预测方法在保证精度的前提下可实现对理想加速效果的有效获取,同时也可将重要的参考信息提供给风电场维护人员。
关键词:风电机组;异常预测;Hadoop批处理;BP神经网络
风能可以说是一种可再生资源,同时具备无污染等明显优势,这也是其受到世界各国广泛重视的主要原因,但是在风电机组长时间运行的过程当中其故障率也会有所增加,这需要我们提高对机组主要不加的重视程度,并做好一系列的预防工作。传统的工作模式只能简单地对数据进行监测和报警,导致在线处理需求不能得到满足,因此现阶段风电机组面对的主要工作就是如何实现科学的异常预测工作。
一、风电设备异常预测模型体系概述
1.模型框架
在实际构建风电设备异常预测模型的过程当中,我们可将模型预测精度与数据处理速度需求作为主要依据。在这一过程中所使用的集群以及框架都必须严格遵守预测精度与运行速度的要求。所构建的模型框架主要包括四个模块,分别为采集层、储存层、分析层以及应用层。下面我们对其进行仔细分析。
(1)数据采集层
风电设备的状态监测数据、天气数据、地理信息数据是数据采集层不可缺少的组成部分。各种特殊传感器,在实际生产运行过程中不可避免的会产生大量的管理数据,这些数据主要呈现出来源不一以及模态各异等状态,同时其存在相当大的重复性,该模块主要对这种异常数据以及重复数据进行彻底的清除侵入除后使用大数据连接器技术将其进行均匀的传输与分布,同时在格式标准化调整的基础上促使人为序列以及反序列化操作得到科学减少。
(2)存储层
本文主要采用HBase,Hive等分布式数据库作为存储介质,HBase是一个构建在HDFS上的分布式列存储系统,它具有高可靠、高性能以及可伸缩等特点,可以方便地在服务器上搭建起大规模结构化存储集群。
(3)分析层
集成有训练好的BP神经网络预测模型,基于SCADA状态监测数据、天气数据以及地理信息数据,应用大数据分析技术进行风电设备的异常状态预测。传统的BP神经网络训练方法在处理海量数据集时面临耗时长,甚至是内存不足无法训练等问题,本文在开源云计算平台Hadoop的基础上,实现了基于MapReduce框架的BP神经网络并行化运行方式,可以并行的对训练样本进行批量训练,大大地提升了模型的精度和运行速度。
(4)应用层
该模块使用训练好的异常预测模型,结合在线输入的监测数据,进而获得状态参数的预测值,计算模型输出值与实际监测值的残差,当残差发生剧烈波动时,判断风电设备的运行状态出现异常,并通过数据可视化技术对相关人员进行展示。
2.基于MapReduce的BP神经网络预测模型
BP神经网络是一种按误差反向传播算法训练的多层前馈网络,在各个领域得到了广泛的应用,它能够很好地表示任意的非线性映射关系,而无需事前了解描述这种映射关系的数学方程。BP神经网络的拓扑结构包括输出层、输入层和若干隐层,它的学习算法使用最速下降法,通过不断调整网络的权值和阀值来使网络的误差平方和最小。
3.风电机组异常预测运行流程
受风速的波动变化和天气的季节性变化影响,风电机组的运行环境经常发生剧烈的动态变化,因而需要在不同的运行工况之间进行频繁地切换,导致设备状态监测数据的幅值在正常运行状态下也会发生较大的变化,这意味着我们不能根据幅值的大小来判断机组的运行安全程度。
而目前主流的做法都是采用阀值报警的方法,即如果监测信号达到了报警阀值,则判断机组的运行状态出现异常,这导致了很多漏报和误报的情况发生,为了提高风电设备异常预测的精确度,本文采用了残差分析的方式對机组的运行状态进行判断。
二、实验结果与应用
为了模拟风电场大数据风电机组异常状态预测的相关情况,在实验室搭建的Hadoop平台上对本文所述方法进行了仿真实验,Hadoop集群由一个主节点(Master)个两个从节点(Slave)组成,各节点是由WindowsServer2012上的Hyper-V管理器创建的虚拟机,节点的内存为2G,硬盘为200G,在开发的过程中用到了Eclipse、Hive、HBase等工具。
实验采用某风电公司风电场提供的2015年6月到2016年9月产生的实际运行数据,其中包含37台风机的监测数据,选取其中15台风机2016年7月份共15组监测数据,按一定的比例抽取数据作为测试样本,对模型进行训练,每组训练1000次,使得模型输出值误差范围达到满意的效果,进而得到性能良好的神经网络预测模型。为了验证模型状态参数预测的精确度,选取对应1台风机2016年7月份的共15组监测数据作为测试样本对模型进行测试,预测下一时刻齿轮箱油温平均值。
其中2台风机实际监测值与模型预测值的对比效果,其中,预测值为蓝色曲线,真实值为红色曲线,可以看到,两条曲线基本吻合,验证了模型的有效性和精确性。为了测试模型并行化之后的加速效果,对同样大小测试数据集分别在单机和集群环境下测试程序运行时间,发现当测试数据量较小时,单机所用时间少于集群运行时间,而随着数据集的增大,集群的计算优势就越来越明显。
结语:
在实际针对海量历史监测数据进行分析的过程中我们必须使用方面设备的异常运行状态,这也是前最为主流的大数据技术,促使风电设备的异常预测模型得以顺利设计与构建。在训练学习的基础上神经网络预测模板可实现并行化的目标,这不仅是提高数据处理效率的重要手段,同时也可加速风电机组异常状态预测的计算过程。通过相关实践我们可以发现正常运行工况下预测模型可实现对状态参数的准确预测。
参考文献:
[1]张少敏,毛冬,王保义.大数据处理技术在风电机组齿轮箱故障诊断与预警中的应用[J].电力系统自动化,2016,40(14):129-134.
[2]刘龙欢.论大数据在风电机组齿轮箱故障诊断及预警中应用[J].工程技术:全文版,2016(12):00261-00261.
关键词:风电机组;异常预测;Hadoop批处理;BP神经网络
风能可以说是一种可再生资源,同时具备无污染等明显优势,这也是其受到世界各国广泛重视的主要原因,但是在风电机组长时间运行的过程当中其故障率也会有所增加,这需要我们提高对机组主要不加的重视程度,并做好一系列的预防工作。传统的工作模式只能简单地对数据进行监测和报警,导致在线处理需求不能得到满足,因此现阶段风电机组面对的主要工作就是如何实现科学的异常预测工作。
一、风电设备异常预测模型体系概述
1.模型框架
在实际构建风电设备异常预测模型的过程当中,我们可将模型预测精度与数据处理速度需求作为主要依据。在这一过程中所使用的集群以及框架都必须严格遵守预测精度与运行速度的要求。所构建的模型框架主要包括四个模块,分别为采集层、储存层、分析层以及应用层。下面我们对其进行仔细分析。
(1)数据采集层
风电设备的状态监测数据、天气数据、地理信息数据是数据采集层不可缺少的组成部分。各种特殊传感器,在实际生产运行过程中不可避免的会产生大量的管理数据,这些数据主要呈现出来源不一以及模态各异等状态,同时其存在相当大的重复性,该模块主要对这种异常数据以及重复数据进行彻底的清除侵入除后使用大数据连接器技术将其进行均匀的传输与分布,同时在格式标准化调整的基础上促使人为序列以及反序列化操作得到科学减少。
(2)存储层
本文主要采用HBase,Hive等分布式数据库作为存储介质,HBase是一个构建在HDFS上的分布式列存储系统,它具有高可靠、高性能以及可伸缩等特点,可以方便地在服务器上搭建起大规模结构化存储集群。
(3)分析层
集成有训练好的BP神经网络预测模型,基于SCADA状态监测数据、天气数据以及地理信息数据,应用大数据分析技术进行风电设备的异常状态预测。传统的BP神经网络训练方法在处理海量数据集时面临耗时长,甚至是内存不足无法训练等问题,本文在开源云计算平台Hadoop的基础上,实现了基于MapReduce框架的BP神经网络并行化运行方式,可以并行的对训练样本进行批量训练,大大地提升了模型的精度和运行速度。
(4)应用层
该模块使用训练好的异常预测模型,结合在线输入的监测数据,进而获得状态参数的预测值,计算模型输出值与实际监测值的残差,当残差发生剧烈波动时,判断风电设备的运行状态出现异常,并通过数据可视化技术对相关人员进行展示。
2.基于MapReduce的BP神经网络预测模型
BP神经网络是一种按误差反向传播算法训练的多层前馈网络,在各个领域得到了广泛的应用,它能够很好地表示任意的非线性映射关系,而无需事前了解描述这种映射关系的数学方程。BP神经网络的拓扑结构包括输出层、输入层和若干隐层,它的学习算法使用最速下降法,通过不断调整网络的权值和阀值来使网络的误差平方和最小。
3.风电机组异常预测运行流程
受风速的波动变化和天气的季节性变化影响,风电机组的运行环境经常发生剧烈的动态变化,因而需要在不同的运行工况之间进行频繁地切换,导致设备状态监测数据的幅值在正常运行状态下也会发生较大的变化,这意味着我们不能根据幅值的大小来判断机组的运行安全程度。
而目前主流的做法都是采用阀值报警的方法,即如果监测信号达到了报警阀值,则判断机组的运行状态出现异常,这导致了很多漏报和误报的情况发生,为了提高风电设备异常预测的精确度,本文采用了残差分析的方式對机组的运行状态进行判断。
二、实验结果与应用
为了模拟风电场大数据风电机组异常状态预测的相关情况,在实验室搭建的Hadoop平台上对本文所述方法进行了仿真实验,Hadoop集群由一个主节点(Master)个两个从节点(Slave)组成,各节点是由WindowsServer2012上的Hyper-V管理器创建的虚拟机,节点的内存为2G,硬盘为200G,在开发的过程中用到了Eclipse、Hive、HBase等工具。
实验采用某风电公司风电场提供的2015年6月到2016年9月产生的实际运行数据,其中包含37台风机的监测数据,选取其中15台风机2016年7月份共15组监测数据,按一定的比例抽取数据作为测试样本,对模型进行训练,每组训练1000次,使得模型输出值误差范围达到满意的效果,进而得到性能良好的神经网络预测模型。为了验证模型状态参数预测的精确度,选取对应1台风机2016年7月份的共15组监测数据作为测试样本对模型进行测试,预测下一时刻齿轮箱油温平均值。
其中2台风机实际监测值与模型预测值的对比效果,其中,预测值为蓝色曲线,真实值为红色曲线,可以看到,两条曲线基本吻合,验证了模型的有效性和精确性。为了测试模型并行化之后的加速效果,对同样大小测试数据集分别在单机和集群环境下测试程序运行时间,发现当测试数据量较小时,单机所用时间少于集群运行时间,而随着数据集的增大,集群的计算优势就越来越明显。
结语:
在实际针对海量历史监测数据进行分析的过程中我们必须使用方面设备的异常运行状态,这也是前最为主流的大数据技术,促使风电设备的异常预测模型得以顺利设计与构建。在训练学习的基础上神经网络预测模板可实现并行化的目标,这不仅是提高数据处理效率的重要手段,同时也可加速风电机组异常状态预测的计算过程。通过相关实践我们可以发现正常运行工况下预测模型可实现对状态参数的准确预测。
参考文献:
[1]张少敏,毛冬,王保义.大数据处理技术在风电机组齿轮箱故障诊断与预警中的应用[J].电力系统自动化,2016,40(14):129-134.
[2]刘龙欢.论大数据在风电机组齿轮箱故障诊断及预警中应用[J].工程技术:全文版,2016(12):00261-00261.