论文部分内容阅读
摘要:汽轮机在进行改造或长期运行以后,其阀门实际流量特性会偏离DEH系统中设置的流量特性参数,这将对机组的安全、稳定、经济运行带来不利影响。因此,本文基于历史运行数据,提出了一种数据挖掘算法来获取汽轮机在混合阀模式下调节阀组的实际流量特性曲线,并对其进行了线性度分析,对非线性区域进行了线性优化,最终实现对阀门管理曲线的优化调整。该方法效率高,耗时少,克服了传统试验法的缺点。
关键词:汽轮机;阀门流量特性;数据挖掘;参数辨识;线性优化
中图分类号:TP3 文献标识码:A
文章编号:1009-3044(2019)30-0233-04
汽轮机调节阀的流量特性是指总阀位指令与机组进汽量的一一对应关系,它是由DEH系统中的配汽函数来进行数值表征,只有当两者相一致时汽轮机才具备良好的控制性能和运行稳定性,而其配汽函数的原始参数一般是由汽轮机厂家设计而来。在实际应用中,由于设备安装偏差、通流部分改造、DEH改造、运行老化等原因,会使调节阀组的实际流量特性偏离控制系统中设置的阀门流量特性参数,以至于引发诸如单阀顺序阀切换时负荷波动大、机组变负荷和一次调频期间机组协调能力不足的问题,造成机组控制困难,影响机组的安全稳定运行。因此,在机组进行改造或长期运行后,对其进行阀门流量特性参数的优化就具有非常重要的意义。目前,最常用的优化方法是进行汽轮机阀门流量特性试验,对试验数据进行分析和计算得到机组的实际流量特性曲线。但传统的试验法过程复杂、工作量大、试验条件苛刻,不仅耗时还消耗大量的人力、物力,而且试验过程还可能对机组的安全稳定运行带来不利影响。因此文献[5]运用机组历史数据建立单个阀门的实际流量特性曲线,对调节阀配汽过程进行仿真,通过改变重叠度对阀门流量特性曲线进行线性优化。优化后的阀门管理曲线提高了负荷的控制精度,改善了机组的一次调频能力。文献[7][8]采用数据挖掘算法求出顺序阀运行方式下调节阀组的实际流量特性曲线,基于给定的目标曲线得到优化后的阀门管理曲线。这种基于大数据分析的阀门流量特性优化方法效率高,耗时少,计算过程简便。
因此,本文基于机组运行的历史数据,采用数据挖掘算法求取汽轮机在混合阀模式下调节阀组的实际流量特性曲线,并对高压调节阀门管理曲线进行优化。
1汽轮机调节阀实际流量特性辨识方法
1.1模型参数选取
在DCS系统中选取与阀门流量特性相关的参数,如表1所示。
1.2稳定工况选取
机组DCS系统中不仅包括稳定工况运行的数据,还存在大量动态过程以及异常情况的数据,在运用历史数据进行调节阀组流量特性曲线辨识之前应对数据进行预处理,筛选出稳定工况的数据,确保获取的数据能反映机组的实际特性。判断机组是否处于热力稳定的原则是将数据严格按照采样时间的先后顺序,若重要参数至少稳定3~4个采样周期(即10s)则认为处于热力稳定。因此,采用下式的逻辑语句进行稳定工况的判定:
其中,yi(k)表示第i个历史数据;k表示采样时刻;yi,max和yi.min表示yi(k)在获得的历史数据中的最大值和最小值;a表示稳定时间;占一般取0.05%-0.25%。重要参数主要选取总阀位指令、机组负荷和主蒸汽压力。
1.3异常数据剔除
文献【7】【8】[9】均采用格拉布斯法来剔除同一工况的异常数据,该方法需对每个工况下的所有数据进行偏离值计算,并与临界值进行比较以此来判断是否为异常值。本文数据量大,若采用格拉布斯方法则计算量大,效率较低。而孤立森林算法fIsolation Forestl是一种非监督异常数据检测方法,算法效率高,效果好,使用简便,能有效处理高维数据和海量数据。算法的基本思想是用一个随机超平面来切割数据空间,切一次可以产生两个子空间,然后继续用一个随机超平面来切割每个子空间,循环以上操作直到每个子空间里只有一个数据点为止。直观上来看,那些異常点因为密度低很快就会从整体中被分割出来,而正常点即密度高的簇要切割多次才能停止。
孤立森林由iTree组成,采用多次迭代方式构建二叉搜索树,并将这些二叉树组成森林。其构建过程如下:首先,从n个数据空间中随机抽取m个样本,随机选取一个特征作为起始节点,并在该特征的值域里随机选择一个值,对m个样本进行二叉划分,将样本中小于该值的数据划分到左分支,剩余的值划分到右分支。然后对左右两个分支分别重复进行以上二叉划分操作,直到节点上只有一个样本点或者树的高度达到了限制值。当二叉森林构建完成后,记录每个数据从根节点到叶子节点的路径长度h(x),以此来计算该数据的异常指数s(x,n)。
经过上述方法计算,可获得某主蒸汽压力下机组总阀位指令与实际进汽量之间的关系,也就是汽轮机调节阀组的实际流量特性曲线。
1.5聚类分析
聚类算法是根据数据集之间的相似程度进行合理归类的一种方法,在同一类别中的数据比不在同一类别中的数据具有更多的相似性。现有文献均采用k-means算法,它是基于距离来衡量数据之间的相似程度,适用于类球形的数据集,而且算法需要预先估计聚类数量,初始中心点的选取不同会直接导致结果的不同。因此本文采用密度峰值(Density Peak)的聚类算法,该算法将距离和密度巧妙地结合起来,假设聚类中心周围都是密度比其低的点,同时这些点与该聚类中心的距离相比于其他聚类中心是最近的,以此来克服基于距离的算法只能发现类圆形聚类的缺点,并且Density peak算法无须提前设定聚类中心数目,算法通用性更强。算法流程如下:
(1)计算每个点的局部密度p;:本文采用高斯核函数来表征点的局部密度:
其中,dij表示点i与点j之间的距离;dc表示邻域半径,需人工设定,可选择为平均每个点的局部密度为数据总数的1-2%。 (2)计算每个点的聚类中心聚类δi:将每个点的局部密度值降序排列,密度最大点的聚类中心距离等于与该点距离最远的点之间的距离;而其他点的聚类中心距离等于在密度大于该点的点集合中,与该点距离最近的点之间的距离。我们可以认为,局部密度和聚类中心距离值都较大的点极有可能是聚类的核心点,而周围密度小且距离其他點远的点就属于噪声点。
(3)确定聚类中心:定义ri=pi*δi,由(2)可知,ri越大,该点就是聚类中心,因此对ri进行降序排列并对其求导,变化最明显处就作为选取聚类中心的分界点。
(4)确定其他点所属类别:聚类中心确定后,当前点的类别标签与高于当前点密度且距离最近的点的标签一致。
2汽轮机混合阀模式下调节阀组流量特性辨识结果
按照表1的相关参数,以3s为采样周期选取600MW机组2019年6月连续一周的历史数据。
首先,按照式(1)筛选出稳定工况的数据,然后采用孤立森林算法剔除异常数据,进一步减少数据量。数据初筛结果如图1所示,机组各参数曲线的走向趋势以及曲线形状未出现失真情况,基本得到了重现,证明本文采用的数据筛选方法科学可行、可靠有效。
其次,按照公式(3)(4)计算汽轮机的实际进汽量和修正后的进汽量,得到调节阀组实际流量特性曲线,如图2所示,对其进行DensiIy peak聚类,结果如图3所示。
对比图2、图3可知,聚类后曲线完全复现了原有曲线的特征形态,在减小数据量的同时有效去掉了噪声数据,提取了最能反映机组实际特性的目标数据,提高了辨识结果的精确度,验证了本文聚类方法的可行性。图3中蓝色直线是依据最小方差原则拟合出的线段以分析实际流量特性曲线的线性度。从图中可知,曲线在总阀位指令80%-100%之间总体线性度较好,只有在88%-90%之间时曲线局部线性度较差且曲线斜率过小,这将导致一次调频调节时负荷响应不足的问题。
为了使AGC响应速率以及一次调频品质满足要求,调节阀组流量特性曲线必须为线性。因此,将图4中直线作为流量特性曲线的优化目标曲线,通过计算得到图5所示的阀门管理曲线。
从图5可知,四个高压调节阀门管理曲线在总阀位指令88%-90%之间进行了一定的调整,而在其他总阀位指令下基本保持不变,以解决流量特性曲线在此区间斜率过小的问题。
3总结
本文基于机组运行的历史数据,提出了一种数据挖掘算法来获取汽轮机混合阀模式下调节阀组的实际流量特性曲线。数据挖掘过程利用无监督异常值检测算法、Density Peak聚类算法以及变工况流量计算来获取调节阀组的实际流量特性曲线,最终实现对阀门管理曲线的优化。
该方法克服了传统试验法的缺点,减轻了工作量。但该方法依赖于历史数据,机组在实际运行过程中基本无法实现全工况运行,因此部分工况的数据会存在缺失,无法得到全工况范围内的调节阀实际流量特性曲线。
关键词:汽轮机;阀门流量特性;数据挖掘;参数辨识;线性优化
中图分类号:TP3 文献标识码:A
文章编号:1009-3044(2019)30-0233-04
汽轮机调节阀的流量特性是指总阀位指令与机组进汽量的一一对应关系,它是由DEH系统中的配汽函数来进行数值表征,只有当两者相一致时汽轮机才具备良好的控制性能和运行稳定性,而其配汽函数的原始参数一般是由汽轮机厂家设计而来。在实际应用中,由于设备安装偏差、通流部分改造、DEH改造、运行老化等原因,会使调节阀组的实际流量特性偏离控制系统中设置的阀门流量特性参数,以至于引发诸如单阀顺序阀切换时负荷波动大、机组变负荷和一次调频期间机组协调能力不足的问题,造成机组控制困难,影响机组的安全稳定运行。因此,在机组进行改造或长期运行后,对其进行阀门流量特性参数的优化就具有非常重要的意义。目前,最常用的优化方法是进行汽轮机阀门流量特性试验,对试验数据进行分析和计算得到机组的实际流量特性曲线。但传统的试验法过程复杂、工作量大、试验条件苛刻,不仅耗时还消耗大量的人力、物力,而且试验过程还可能对机组的安全稳定运行带来不利影响。因此文献[5]运用机组历史数据建立单个阀门的实际流量特性曲线,对调节阀配汽过程进行仿真,通过改变重叠度对阀门流量特性曲线进行线性优化。优化后的阀门管理曲线提高了负荷的控制精度,改善了机组的一次调频能力。文献[7][8]采用数据挖掘算法求出顺序阀运行方式下调节阀组的实际流量特性曲线,基于给定的目标曲线得到优化后的阀门管理曲线。这种基于大数据分析的阀门流量特性优化方法效率高,耗时少,计算过程简便。
因此,本文基于机组运行的历史数据,采用数据挖掘算法求取汽轮机在混合阀模式下调节阀组的实际流量特性曲线,并对高压调节阀门管理曲线进行优化。
1汽轮机调节阀实际流量特性辨识方法
1.1模型参数选取
在DCS系统中选取与阀门流量特性相关的参数,如表1所示。
1.2稳定工况选取
机组DCS系统中不仅包括稳定工况运行的数据,还存在大量动态过程以及异常情况的数据,在运用历史数据进行调节阀组流量特性曲线辨识之前应对数据进行预处理,筛选出稳定工况的数据,确保获取的数据能反映机组的实际特性。判断机组是否处于热力稳定的原则是将数据严格按照采样时间的先后顺序,若重要参数至少稳定3~4个采样周期(即10s)则认为处于热力稳定。因此,采用下式的逻辑语句进行稳定工况的判定:
其中,yi(k)表示第i个历史数据;k表示采样时刻;yi,max和yi.min表示yi(k)在获得的历史数据中的最大值和最小值;a表示稳定时间;占一般取0.05%-0.25%。重要参数主要选取总阀位指令、机组负荷和主蒸汽压力。
1.3异常数据剔除
文献【7】【8】[9】均采用格拉布斯法来剔除同一工况的异常数据,该方法需对每个工况下的所有数据进行偏离值计算,并与临界值进行比较以此来判断是否为异常值。本文数据量大,若采用格拉布斯方法则计算量大,效率较低。而孤立森林算法fIsolation Forestl是一种非监督异常数据检测方法,算法效率高,效果好,使用简便,能有效处理高维数据和海量数据。算法的基本思想是用一个随机超平面来切割数据空间,切一次可以产生两个子空间,然后继续用一个随机超平面来切割每个子空间,循环以上操作直到每个子空间里只有一个数据点为止。直观上来看,那些異常点因为密度低很快就会从整体中被分割出来,而正常点即密度高的簇要切割多次才能停止。
孤立森林由iTree组成,采用多次迭代方式构建二叉搜索树,并将这些二叉树组成森林。其构建过程如下:首先,从n个数据空间中随机抽取m个样本,随机选取一个特征作为起始节点,并在该特征的值域里随机选择一个值,对m个样本进行二叉划分,将样本中小于该值的数据划分到左分支,剩余的值划分到右分支。然后对左右两个分支分别重复进行以上二叉划分操作,直到节点上只有一个样本点或者树的高度达到了限制值。当二叉森林构建完成后,记录每个数据从根节点到叶子节点的路径长度h(x),以此来计算该数据的异常指数s(x,n)。
经过上述方法计算,可获得某主蒸汽压力下机组总阀位指令与实际进汽量之间的关系,也就是汽轮机调节阀组的实际流量特性曲线。
1.5聚类分析
聚类算法是根据数据集之间的相似程度进行合理归类的一种方法,在同一类别中的数据比不在同一类别中的数据具有更多的相似性。现有文献均采用k-means算法,它是基于距离来衡量数据之间的相似程度,适用于类球形的数据集,而且算法需要预先估计聚类数量,初始中心点的选取不同会直接导致结果的不同。因此本文采用密度峰值(Density Peak)的聚类算法,该算法将距离和密度巧妙地结合起来,假设聚类中心周围都是密度比其低的点,同时这些点与该聚类中心的距离相比于其他聚类中心是最近的,以此来克服基于距离的算法只能发现类圆形聚类的缺点,并且Density peak算法无须提前设定聚类中心数目,算法通用性更强。算法流程如下:
(1)计算每个点的局部密度p;:本文采用高斯核函数来表征点的局部密度:
其中,dij表示点i与点j之间的距离;dc表示邻域半径,需人工设定,可选择为平均每个点的局部密度为数据总数的1-2%。 (2)计算每个点的聚类中心聚类δi:将每个点的局部密度值降序排列,密度最大点的聚类中心距离等于与该点距离最远的点之间的距离;而其他点的聚类中心距离等于在密度大于该点的点集合中,与该点距离最近的点之间的距离。我们可以认为,局部密度和聚类中心距离值都较大的点极有可能是聚类的核心点,而周围密度小且距离其他點远的点就属于噪声点。
(3)确定聚类中心:定义ri=pi*δi,由(2)可知,ri越大,该点就是聚类中心,因此对ri进行降序排列并对其求导,变化最明显处就作为选取聚类中心的分界点。
(4)确定其他点所属类别:聚类中心确定后,当前点的类别标签与高于当前点密度且距离最近的点的标签一致。
2汽轮机混合阀模式下调节阀组流量特性辨识结果
按照表1的相关参数,以3s为采样周期选取600MW机组2019年6月连续一周的历史数据。
首先,按照式(1)筛选出稳定工况的数据,然后采用孤立森林算法剔除异常数据,进一步减少数据量。数据初筛结果如图1所示,机组各参数曲线的走向趋势以及曲线形状未出现失真情况,基本得到了重现,证明本文采用的数据筛选方法科学可行、可靠有效。
其次,按照公式(3)(4)计算汽轮机的实际进汽量和修正后的进汽量,得到调节阀组实际流量特性曲线,如图2所示,对其进行DensiIy peak聚类,结果如图3所示。
对比图2、图3可知,聚类后曲线完全复现了原有曲线的特征形态,在减小数据量的同时有效去掉了噪声数据,提取了最能反映机组实际特性的目标数据,提高了辨识结果的精确度,验证了本文聚类方法的可行性。图3中蓝色直线是依据最小方差原则拟合出的线段以分析实际流量特性曲线的线性度。从图中可知,曲线在总阀位指令80%-100%之间总体线性度较好,只有在88%-90%之间时曲线局部线性度较差且曲线斜率过小,这将导致一次调频调节时负荷响应不足的问题。
为了使AGC响应速率以及一次调频品质满足要求,调节阀组流量特性曲线必须为线性。因此,将图4中直线作为流量特性曲线的优化目标曲线,通过计算得到图5所示的阀门管理曲线。
从图5可知,四个高压调节阀门管理曲线在总阀位指令88%-90%之间进行了一定的调整,而在其他总阀位指令下基本保持不变,以解决流量特性曲线在此区间斜率过小的问题。
3总结
本文基于机组运行的历史数据,提出了一种数据挖掘算法来获取汽轮机混合阀模式下调节阀组的实际流量特性曲线。数据挖掘过程利用无监督异常值检测算法、Density Peak聚类算法以及变工况流量计算来获取调节阀组的实际流量特性曲线,最终实现对阀门管理曲线的优化。
该方法克服了传统试验法的缺点,减轻了工作量。但该方法依赖于历史数据,机组在实际运行过程中基本无法实现全工况运行,因此部分工况的数据会存在缺失,无法得到全工况范围内的调节阀实际流量特性曲线。