论文部分内容阅读
1.西北工业大学电子信息学院,陕西西安 710129
2.西北工业大学力学与土木建筑学院,陕西西安 710129
3.西北工业大学计算机学院,陕西西安 710129
摘 要 本文针对高炉冶炼优质铁水的过程,以由铁水含硅量[Si]、含硫量[S]、喷煤量PML和鼓风量组成的数据库作为数学建模分析和数据挖掘的基础,建立基于误差反向传播神经网络[Si]的动态预测数学模型,以SML和ML作为输入参数,对于Si含量进行预测,通过在一定时间间隔内更新固定步数的训练样本,体现时间的累积效果,来提高预测的准确性。
关键词 高炉炼铁;神经网络;Si预测;控制
中图分类号 TP3 文献标识码 A 文章编号 2095-6363(2017)13-0017-01
炼铁过程依时间顺序采集的工艺参数是一个高维大数据时间序列,影响因素极多,然而其终极生产指标产量、能耗、铁水质量等都与冶炼过程中的一项控制性中间指标——炉温密切相关,炉温又可以用铁水含硅量进行描述,从而铁水含硅量的时间序列的预测关系着当前高炉各项操作参数的调控方向。因此,铁水含硅量的准确预测控制建模成为冶炼过程优化与预测控制的关键技术。
1 模型的建立
以误差逆传播神经网络为例,神经网络预测主要的计算过程由每个感知机的输入权重、阈值、激励函数、反馈函数以及神经网絡的整体结构所决定。而神经网络的结构则包括了隐层数目以及每个隐层所包含的神经元的数目,感知机的阈值则由样本根据学习函数迭代产生。所以为了得到最优的神经网络模型,我们需要确定的参数包括网络的隐层数目,每个隐层的神经元数目,学习函数,每层的传播函数,每个感知机的激励函数,迭代次数,学习率。
我们可以发现,要得到一个性能优良的神经网络模型,需要调节的参数主要有8类,不便于优化。因此,我们根据题目进行参数的筛选,由初步试验得到,其中影响预测网络性能的主要因素为隐层数目,每个隐层的神经元数目,学习函数,激励函数。因此,我们将其余因素限定为合理数值,然后对于主要参数进行优化。
对于传递函数,由于样本的输入矩阵为二维,而输出矩阵为一维,但是输入参数与输出参数的关系较为复杂,不宜采用简单线性函数,所以我们采用S型对数函数作为传播函数。
对于学习函数,考虑到样本的复杂性,我们选取自适应梯度递减训练函数,训练函数,动量及自适应梯度递减训练函数作为待选函数,通过控制变量的方法选取最优学习函数[2]。
对于隐层数目,我们一般认为增加隐层数目有提高预测精度的效果,但是如果隐层数目过多可能会出现过拟合的现象,使得神经网络对于新样本的预测能力较弱,因此我们将网络的隐层设置为2至6层,同样通过控制变量的方法确定最优隐层数目。
在确定隐层数目之后,我们先经验设置每个隐层的初始神经元数目,再把每层神经元数目在一定范围内进行调节,从而得到每个隐层合适的神经元数目。
由此,我们可以确定优化后的神经网络整体结构,再通过这个网络进行学习的过程中,我们应该考虑到时间的累积影响。因在此网络模型的基础上,我们通过在一定时间间隔内将样本进行更新,来考虑时间的累积影响。可以将选择一步预测和两步预测的方式。即在已有样本的基础上,每次分别更新一个样本和两个样本,并对两种方案进行比较。
我们首先确定神经网络模型中的次要参数,可以设定迭代上限次数为10 000次,学习速率为,目标误差值为0.000 4,并确定型对数函数作为传播函数,随后,我們在此基础上对神经网络模型进行进一步优化。
2 学习函数的优化
在优化隐层函数及各层感知机个数之前,我们需要先确定最优的学习函数。由模型建立部分可得,我们将自适应梯度递减训练函数,训练函数,动量及自适应梯度递减训练函数作为待选函数。在限定隐层为层的条件下,我们可以明显发现,在其他参数相同的条件下,以训练函数为学习函数的神经网络模型在数值准确率和方向准确率上均有明显的优秀性能。因此,我们采用训练函数作为我们的学习函数。
3 隐层数目及感知机数目的确定
在确定学习函数的基础上,我们通过调节隐层数目及各个隐层感知机数目来确定最优的网络模型。我们通过实验发现,在隐层数目由6层变化为2层的过程中,数值准确率与方向准确率数值变化趋势相同,均为先升高再降低,并且我们可以发现,在隐层数目为5层的时候,数值准确率与方向准确率均达到峰值,因此,我们可以确定隐层数目为5是最优的。
在确定隐层数目为5层的基础上,我们继续分析每层所安排的感知机数目,根据实际约束条件,我们把感知机数目分布离散化处理,先在较大的间隔内训练样本,之后选取最优两组感知机,再进行间隔的缩小化处理,通过比较我们可以发现,在5个隐层的感知机数目满足的时候,达到最优的准确率。
4 考虑时间累积效果
本小节之前的训练,均是建立在静态的预测之上的,并没有考虑时间的累积效果。我们将时间因素考虑在内,分别采用一步预测和两步预测的方式进行预测,得到结果如表1所示。
5 结论
通过比较我们可以发现,考虑时间累积效果的一步预测和两步预测与未考虑时间累积效果的预测相比,数值准确率与方向准确率均较高。两种预测之间,一步预测的效果比两步预测的效果稍好,但是两种预测模型的偏差百分比较小。
参考文献
[1]崔桂梅,李静,张勇,等.高炉铁水温度的多元时间序列建模和预测[J].钢铁研究学报,2014,26(4):33-37.
[2]周志华.机器学习[M].北京:清华大学出版社,2016.
[3]邓乃扬,田英杰.数据挖掘中的新方法—支持向量机[M].北京:科学出版社,2004.
[4]唐贤伦,庄陵,胡向东.铁水硅含量的混沌粒子群支持向量机预报方法[J].控制理论与应用,2009,26(8):838-842.
2.西北工业大学力学与土木建筑学院,陕西西安 710129
3.西北工业大学计算机学院,陕西西安 710129
摘 要 本文针对高炉冶炼优质铁水的过程,以由铁水含硅量[Si]、含硫量[S]、喷煤量PML和鼓风量组成的数据库作为数学建模分析和数据挖掘的基础,建立基于误差反向传播神经网络[Si]的动态预测数学模型,以SML和ML作为输入参数,对于Si含量进行预测,通过在一定时间间隔内更新固定步数的训练样本,体现时间的累积效果,来提高预测的准确性。
关键词 高炉炼铁;神经网络;Si预测;控制
中图分类号 TP3 文献标识码 A 文章编号 2095-6363(2017)13-0017-01
炼铁过程依时间顺序采集的工艺参数是一个高维大数据时间序列,影响因素极多,然而其终极生产指标产量、能耗、铁水质量等都与冶炼过程中的一项控制性中间指标——炉温密切相关,炉温又可以用铁水含硅量进行描述,从而铁水含硅量的时间序列的预测关系着当前高炉各项操作参数的调控方向。因此,铁水含硅量的准确预测控制建模成为冶炼过程优化与预测控制的关键技术。
1 模型的建立
以误差逆传播神经网络为例,神经网络预测主要的计算过程由每个感知机的输入权重、阈值、激励函数、反馈函数以及神经网絡的整体结构所决定。而神经网络的结构则包括了隐层数目以及每个隐层所包含的神经元的数目,感知机的阈值则由样本根据学习函数迭代产生。所以为了得到最优的神经网络模型,我们需要确定的参数包括网络的隐层数目,每个隐层的神经元数目,学习函数,每层的传播函数,每个感知机的激励函数,迭代次数,学习率。
我们可以发现,要得到一个性能优良的神经网络模型,需要调节的参数主要有8类,不便于优化。因此,我们根据题目进行参数的筛选,由初步试验得到,其中影响预测网络性能的主要因素为隐层数目,每个隐层的神经元数目,学习函数,激励函数。因此,我们将其余因素限定为合理数值,然后对于主要参数进行优化。
对于传递函数,由于样本的输入矩阵为二维,而输出矩阵为一维,但是输入参数与输出参数的关系较为复杂,不宜采用简单线性函数,所以我们采用S型对数函数作为传播函数。
对于学习函数,考虑到样本的复杂性,我们选取自适应梯度递减训练函数,训练函数,动量及自适应梯度递减训练函数作为待选函数,通过控制变量的方法选取最优学习函数[2]。
对于隐层数目,我们一般认为增加隐层数目有提高预测精度的效果,但是如果隐层数目过多可能会出现过拟合的现象,使得神经网络对于新样本的预测能力较弱,因此我们将网络的隐层设置为2至6层,同样通过控制变量的方法确定最优隐层数目。
在确定隐层数目之后,我们先经验设置每个隐层的初始神经元数目,再把每层神经元数目在一定范围内进行调节,从而得到每个隐层合适的神经元数目。
由此,我们可以确定优化后的神经网络整体结构,再通过这个网络进行学习的过程中,我们应该考虑到时间的累积影响。因在此网络模型的基础上,我们通过在一定时间间隔内将样本进行更新,来考虑时间的累积影响。可以将选择一步预测和两步预测的方式。即在已有样本的基础上,每次分别更新一个样本和两个样本,并对两种方案进行比较。
我们首先确定神经网络模型中的次要参数,可以设定迭代上限次数为10 000次,学习速率为,目标误差值为0.000 4,并确定型对数函数作为传播函数,随后,我們在此基础上对神经网络模型进行进一步优化。
2 学习函数的优化
在优化隐层函数及各层感知机个数之前,我们需要先确定最优的学习函数。由模型建立部分可得,我们将自适应梯度递减训练函数,训练函数,动量及自适应梯度递减训练函数作为待选函数。在限定隐层为层的条件下,我们可以明显发现,在其他参数相同的条件下,以训练函数为学习函数的神经网络模型在数值准确率和方向准确率上均有明显的优秀性能。因此,我们采用训练函数作为我们的学习函数。
3 隐层数目及感知机数目的确定
在确定学习函数的基础上,我们通过调节隐层数目及各个隐层感知机数目来确定最优的网络模型。我们通过实验发现,在隐层数目由6层变化为2层的过程中,数值准确率与方向准确率数值变化趋势相同,均为先升高再降低,并且我们可以发现,在隐层数目为5层的时候,数值准确率与方向准确率均达到峰值,因此,我们可以确定隐层数目为5是最优的。
在确定隐层数目为5层的基础上,我们继续分析每层所安排的感知机数目,根据实际约束条件,我们把感知机数目分布离散化处理,先在较大的间隔内训练样本,之后选取最优两组感知机,再进行间隔的缩小化处理,通过比较我们可以发现,在5个隐层的感知机数目满足的时候,达到最优的准确率。
4 考虑时间累积效果
本小节之前的训练,均是建立在静态的预测之上的,并没有考虑时间的累积效果。我们将时间因素考虑在内,分别采用一步预测和两步预测的方式进行预测,得到结果如表1所示。
5 结论
通过比较我们可以发现,考虑时间累积效果的一步预测和两步预测与未考虑时间累积效果的预测相比,数值准确率与方向准确率均较高。两种预测之间,一步预测的效果比两步预测的效果稍好,但是两种预测模型的偏差百分比较小。
参考文献
[1]崔桂梅,李静,张勇,等.高炉铁水温度的多元时间序列建模和预测[J].钢铁研究学报,2014,26(4):33-37.
[2]周志华.机器学习[M].北京:清华大学出版社,2016.
[3]邓乃扬,田英杰.数据挖掘中的新方法—支持向量机[M].北京:科学出版社,2004.
[4]唐贤伦,庄陵,胡向东.铁水硅含量的混沌粒子群支持向量机预报方法[J].控制理论与应用,2009,26(8):838-842.