论文部分内容阅读
流程工业系统包含众多过程变量以及各种复杂的物理、化学变化。采用传统的机理模型对这样的过程进行建模难度较大。基于数据驱动的建模方法是基于过程采集数据建立的,具有不需要深入了解过程机理、算法通用性强等特点,广泛应用于流程工业的建模及优化中。由于工业过程的数据具有非线性强、耦合度高、包含噪声及动态性等特征,传统的线性回归模型难以建立较为准确的模型。本文着重研究了数据驱动建模方法中的非线性模型,即用于建立非线性关系的神经网络模型以及用于提取非线性特征的主曲线模型。本文在原有方法基础上将统计学方法与神经网络方法进行结合,并首次将主曲线方法成功地用于非线性回归中。主要成果如下:●针对工业数据的非线性、含噪声、共线性以及动态强等特征,提出了基于DPCA-RBF网络的软测量模型。首先采用动态PCA方法对工业建模数据进行预处理得到主元,然后建立主元和关键质量变量的RBF网络模型。该模型有效地降低了模型变量的数目并除去了噪声以及动态性等信息,并减少了RBF网络训练的参数的个数,提高了模型的准确性。●着重研究了基于神经网络的非线性PCA方法以及基于主曲线的非线性PCA方法。从原理上分析了这两种非线性特征提取方法各自的特点,并采用典型非线性函数以及TE过程数据对这两种方法进行了比较研究。结果表明,基于主曲线的NLPCA模型要优于基于神经网络的NLPCA模型。基于主曲线的NLPCA模型其精确性更高,更符合非线性PCA的思想,并且其主元得分形式也更稳定。●针对工业过程数据维数高、数据相互耦合、非线性强的特点,提出了基于主曲线的非线性回归模型。该模型借鉴了PLS的基本思想,采用主曲线提取隐变量信息的同时考虑到了自变量与因变量的相关性;在隐变量空间中,采用多项式函数拟合隐变量之间的非线性关系。在实例研究中,分别采用纯函数数据和氯乙烯精馏塔实时运行数据对该模型进行了验证。仿真结果表明,该模型所需要的隐变量数目比线性PLS模型、多项式PLS模型更少,并且其模型结果更加精确,可较好地处理工业过程中存在的数据高耦合度以及强非线性问题。