论文部分内容阅读
摘要:目前,锅炉控制大多数已采用自动控制系统,但在锅炉控制现场,其采集的数据往往受到不同程度干扰,难以保证控制系统的准确性和精确性,因此,需要对现场采集的数据进行预处理。本文针对链条炉数据复杂、干扰大的特点,结合河北理工大学智能仪器厂的链条炉自动控制系统,给出了实时数据预处理方法。运行结果表明,采用本方法处理的数据具有较强的适用性和稳定性。
关键词:链条炉自动控制 数据预处理 实时采集
0 引言
近年来,计算机自动控制系统已成功地应用于锅炉控制系统中,然而由于控制现场环境恶劣,使得分布在现场的测控元件所采集到的数据有噪声,有些数据因转换原理或元器件温漂、老化等,还包含有系统误差。虽然在计算机测控系统中,也使用了多种硬件抗干扰技术,力求计算机采集的数据准确,但是也不能完全保证数据的可靠性,加之硬件抗干扰的成本较高,所以通常采用硬件抗干扰和软件处理方法结合,确保采集数据接近真实值。所以,控制系统中采集的数据在参与控制决策或输出显示等之前需要进行数据预处理。
1 数据预处理
传统的锅炉控制系统中不对原始数据做数据预处理或只是做一些简单的平滑处理,通过对链条炉运行参数的分析,发现不做数据预处理或只经过简单平滑处理的数据无法满足控制系统的需要。因此,本系统的数据处理主要是接受并理解用户的要求,确定任务,抽取与系统控制任务相关的数据源,根据领域知识中的约束规则对数据进行合法性检查,通过清理和曲线拟合等操作,生成控制系统所需要的目标数据。
2 实时数据预处理方案
结合河北理工大学智能仪器厂的链条炉自动控制系统,本方法采集的数据主要包括:链条炉输出功率、炉膛温度、炉排变频机频率、鼓风变频机频率、引风变频机频率等。这些数据通过下位机PLC传入上位机计算机进行数据预处理,将PLC的传输频率设置成每6s传输一次,数据通过清洗后一分钟做一次平均,再将做完平均处理后的数据进行曲线拟合,最后将曲线拟合处理后的数据送入数据库,参与控制系统的运行。
对数据的预处理主要包括以下五部分:数据集成、数据清洗、数据平均、曲线拟合和数据转换。
2.1 数据集成 链条炉控制系统中所需的各个数据是从不同的实际采集系统中获得,它们具有不同的采集策略(例如:采集频率不同),要将它们放在同一个数据库中需要一个统一的标准。在此,通过分析将时间作为统一标准,即同一时刻(精确到6s)不同属性相应的数据作为一条记录。
2.2 数据清洗 这里数据清洗主要完成的工作包括噪声数据的处理和缺值数据的处理。
在原始数据集中,由于受实际系统干扰等因素的影响,会出现一些噪声数据。噪声数据主要是指数据值超出正常范围的数据,简单地讲就是太大或太小的数据值。如表1中第4行所示的链条炉输出功率,根據实际40t链条炉正常运行炉况可知,输出功率值小于0MW,大于29MW都属于不正常值。这些不正常值不符合实际工艺要求或根本不能出现在生产过程中,一般来讲,噪声数据量不会太大,但有时极少量的这些数据会对系统带来较大负面影响,所以应对其进行数据清理,将不在正常范围内的数据删除。
原始数据除了在数据清理过滤错误数据时会产生缺失,其本身也有缺失数据。但是我们要求将所有数据集成到同一数据库时,需要每个时间点上都有数据并且数据个数是一致的,因此按照这个要求,如果某一时间点没有对应的数据,将对其进行补齐。如在表1中第八、九行的输出功率的时间点所示,在26s和38s之间就“丢失”了数据,那么要对这些“丢失”的数据进行补齐。如果缺失数据的前后时间间隔不大,采用线性插值的方法将其补上。例如:如果已知n时刻、n+i时刻的输出功率值ωn、ωn+i,而缺少中间的数据,则中间时刻n+j的取值为:
ωn+j=ωn+ ×j, 0<j<i(1)
如果时间间隔较大,则线性插值的效果不理想,我们采用相邻时刻的数据来代替。
2.3 数据平均
数据平均也就是对一定时间段内采集的原始数据求平均值。本系统中,每一分钟对数据做一次平均。下位机PLC每6s钟传输一次数据到计算机的临时数据库中,在经过数据集成和数据清理后,每传送10个数据(一分钟)后就对其求平均值,再将平均值送入数据库进一步处理。
2.4 曲线拟合
曲线拟合(curve fitting)是指通过实验获得有限对观测数据(xi,yi),选择适当的曲线类型y=f(x)来拟合观测数据,并用拟合的曲线方程分析两变量间的关系。曲线拟合并不要求曲线y=f(x)通过所有离散点(xi,yi),只要求反映这些离散点的一般趋势,不出现局部波动。
通过对链条炉运行参数的分析,4次多项式能够较好地反应链条炉的运行特性,且具有较高的预测准确性。因此,本系统采用4次多项式曲线拟合的方式对经过平均处理后的数据进行再次处理。例如,系统内,每分钟会传入一个输出功率的值,等到传入30个数据(30min)时开始做曲线拟合,此后每分钟会传入一个新数据,总是保持用最新的30个数据做拟合,曲线拟合是实时进行的。
曲线拟合的4次多项式为:f(x)=a0+a1x+a2x2+a3x3+a4x4(2)
拟合后的数据作为链条炉显示和参与下一步控制的数据使用。
图1所示为现场实际采集的数据经过数据预处理后实际运行的曲线图。
3 结束语
实时数据采集及数据预处理系统对于链条炉的上位机系统分析判断链条炉运行状况、处理突发情况以及制定相关控制策略具有非常重要的作用。本文所提到的数据预处理方法是针对链条炉自动控制系统,在实际应用中取得了较好的效果。
参考文献:
[1]金旭.数据挖掘中数据预处理的研究与实现[J].计算机应用研究,2004(7):117-157.
[2]刘明吉,王秀峰.数据挖掘中的数据预处理[J].计算机科学,2000,27(4):54-57.
[3]行小帅,焦李成.数据挖掘的聚类方法[J].电路与系统学报,2003,8(1):59-66.
关键词:链条炉自动控制 数据预处理 实时采集
0 引言
近年来,计算机自动控制系统已成功地应用于锅炉控制系统中,然而由于控制现场环境恶劣,使得分布在现场的测控元件所采集到的数据有噪声,有些数据因转换原理或元器件温漂、老化等,还包含有系统误差。虽然在计算机测控系统中,也使用了多种硬件抗干扰技术,力求计算机采集的数据准确,但是也不能完全保证数据的可靠性,加之硬件抗干扰的成本较高,所以通常采用硬件抗干扰和软件处理方法结合,确保采集数据接近真实值。所以,控制系统中采集的数据在参与控制决策或输出显示等之前需要进行数据预处理。
1 数据预处理
传统的锅炉控制系统中不对原始数据做数据预处理或只是做一些简单的平滑处理,通过对链条炉运行参数的分析,发现不做数据预处理或只经过简单平滑处理的数据无法满足控制系统的需要。因此,本系统的数据处理主要是接受并理解用户的要求,确定任务,抽取与系统控制任务相关的数据源,根据领域知识中的约束规则对数据进行合法性检查,通过清理和曲线拟合等操作,生成控制系统所需要的目标数据。
2 实时数据预处理方案
结合河北理工大学智能仪器厂的链条炉自动控制系统,本方法采集的数据主要包括:链条炉输出功率、炉膛温度、炉排变频机频率、鼓风变频机频率、引风变频机频率等。这些数据通过下位机PLC传入上位机计算机进行数据预处理,将PLC的传输频率设置成每6s传输一次,数据通过清洗后一分钟做一次平均,再将做完平均处理后的数据进行曲线拟合,最后将曲线拟合处理后的数据送入数据库,参与控制系统的运行。
对数据的预处理主要包括以下五部分:数据集成、数据清洗、数据平均、曲线拟合和数据转换。
2.1 数据集成 链条炉控制系统中所需的各个数据是从不同的实际采集系统中获得,它们具有不同的采集策略(例如:采集频率不同),要将它们放在同一个数据库中需要一个统一的标准。在此,通过分析将时间作为统一标准,即同一时刻(精确到6s)不同属性相应的数据作为一条记录。
2.2 数据清洗 这里数据清洗主要完成的工作包括噪声数据的处理和缺值数据的处理。
在原始数据集中,由于受实际系统干扰等因素的影响,会出现一些噪声数据。噪声数据主要是指数据值超出正常范围的数据,简单地讲就是太大或太小的数据值。如表1中第4行所示的链条炉输出功率,根據实际40t链条炉正常运行炉况可知,输出功率值小于0MW,大于29MW都属于不正常值。这些不正常值不符合实际工艺要求或根本不能出现在生产过程中,一般来讲,噪声数据量不会太大,但有时极少量的这些数据会对系统带来较大负面影响,所以应对其进行数据清理,将不在正常范围内的数据删除。
原始数据除了在数据清理过滤错误数据时会产生缺失,其本身也有缺失数据。但是我们要求将所有数据集成到同一数据库时,需要每个时间点上都有数据并且数据个数是一致的,因此按照这个要求,如果某一时间点没有对应的数据,将对其进行补齐。如在表1中第八、九行的输出功率的时间点所示,在26s和38s之间就“丢失”了数据,那么要对这些“丢失”的数据进行补齐。如果缺失数据的前后时间间隔不大,采用线性插值的方法将其补上。例如:如果已知n时刻、n+i时刻的输出功率值ωn、ωn+i,而缺少中间的数据,则中间时刻n+j的取值为:
ωn+j=ωn+ ×j, 0<j<i(1)
如果时间间隔较大,则线性插值的效果不理想,我们采用相邻时刻的数据来代替。
2.3 数据平均
数据平均也就是对一定时间段内采集的原始数据求平均值。本系统中,每一分钟对数据做一次平均。下位机PLC每6s钟传输一次数据到计算机的临时数据库中,在经过数据集成和数据清理后,每传送10个数据(一分钟)后就对其求平均值,再将平均值送入数据库进一步处理。
2.4 曲线拟合
曲线拟合(curve fitting)是指通过实验获得有限对观测数据(xi,yi),选择适当的曲线类型y=f(x)来拟合观测数据,并用拟合的曲线方程分析两变量间的关系。曲线拟合并不要求曲线y=f(x)通过所有离散点(xi,yi),只要求反映这些离散点的一般趋势,不出现局部波动。
通过对链条炉运行参数的分析,4次多项式能够较好地反应链条炉的运行特性,且具有较高的预测准确性。因此,本系统采用4次多项式曲线拟合的方式对经过平均处理后的数据进行再次处理。例如,系统内,每分钟会传入一个输出功率的值,等到传入30个数据(30min)时开始做曲线拟合,此后每分钟会传入一个新数据,总是保持用最新的30个数据做拟合,曲线拟合是实时进行的。
曲线拟合的4次多项式为:f(x)=a0+a1x+a2x2+a3x3+a4x4(2)
拟合后的数据作为链条炉显示和参与下一步控制的数据使用。
图1所示为现场实际采集的数据经过数据预处理后实际运行的曲线图。
3 结束语
实时数据采集及数据预处理系统对于链条炉的上位机系统分析判断链条炉运行状况、处理突发情况以及制定相关控制策略具有非常重要的作用。本文所提到的数据预处理方法是针对链条炉自动控制系统,在实际应用中取得了较好的效果。
参考文献:
[1]金旭.数据挖掘中数据预处理的研究与实现[J].计算机应用研究,2004(7):117-157.
[2]刘明吉,王秀峰.数据挖掘中的数据预处理[J].计算机科学,2000,27(4):54-57.
[3]行小帅,焦李成.数据挖掘的聚类方法[J].电路与系统学报,2003,8(1):59-66.