论文部分内容阅读
双酚A生产过程中的对象一般都具备多变量、非线性、多工况等复杂特性,采用单一的数据驱动模型难以准确的描述它的过程特性,并且所建立模型的预测精度也较差。如何提高模型的预测精度是需要解决的难点问题,多模型建模方法在软测量中的应用为此提供了有效的解决途径。为了进一步提高复杂工业过程中软测量模型的预测精度,本文主要研究基于多模型的软测量建模方法,从样本缺失数据的补全和聚类方法的改进等角度来提高多模型建模的预测精度。结合实际工业背景,分别对双酚A生成过程中的结晶单元进行单一模型建模和多模型建模来进行对比,主要的研究成果如下:(1)工业过程中样本数据缺失的现象普遍并且缺失情况较为严重。如果能对缺失数据进行有效的补全,不但能增加模型训练样本的数量,还能提高所建立多模型的预测精度。针对k近邻补全算法在缺失数据的近邻选择上存在的偏向性问题,提出了一种改进的k近邻数据补全算法。改进算法有效的解决了k近邻补全算法在近邻选取上的偏向性,并且根据选取的近邻样本与缺失样本之间的距离不同,赋予近邻样本不同的权值。对补全后的样本数据进行k均值聚类,再通过高斯过程回归建立样本的子模型,采用“开关切换”的子模型融合方式得到最终的多模型。采用来自双酚A生产过程中结晶单元C303的350组数据进行训练,50组用于测试。仿真结果显示补全后的多模型预测结果平均相对误差为1.18%,相比于单模型和未补全的多模型具有更高的预测精度。(2)聚类是多模型软测量建模中的一种重要的方法,通过对样本数据准确的聚类,可以有效的提高多模型建模的预测精度。针对传统聚类方法过于依赖样本的空间分布和先验知识等缺点,本文提出了一种改进的扩张搜索聚类算法。该算法充分考虑了样本疏密度的影响,适用于各种形状的样本分布,根据每个样本点的疏密度给予不同的搜索半径距离,并引入阈值对不同疏密度的样本点采用不同的聚类方式。分别使用改进的扩张搜索聚类算法、扩张搜索聚类算法以及k均值聚类算法对样本进行聚类,聚类后的样本采用高斯过程回归建模,并且利用“开关切换”的融合方式得到最终的多模型。采用来自双酚A生产过程中溶解罐V304的300组数据进行训练,50组用于测试。仿真结果表明基于改进的扩张搜索聚类算法建立的软测量多模型的平均相对误差为1.2%,相比于其它对比方法具有更高的预测精度。(3)针对模糊C均值聚类算法中存在的缺点,提出了一种改进的混合蛙跳算法与模糊C均值聚类相结合的聚类算法。首先研究混合蛙跳算法的寻优机制,针对其存在容易陷入局部最优和收敛效果不理想等问题,提出了一种改进的混合蛙跳算法。将改进的混合蛙跳算法运用到模糊C均值聚类方法中来获得最优的聚类中心。利用得到的最优聚类中心对样本进行类别划分,用高斯过程回归对聚类后的各类样本子集分别建立对应的子模型,通过“加权求和”的子模型融合方法得到最终的系统输出。采用来自双酚A生产过程中溶解罐V304的300组数据进行训练,50组用于测试。仿真结果表明基于改进的混合蛙跳算法与模糊C均值相结合的聚类方法建立的软测量多模型的平均相对误差为0.85%,该方法有效提高了多模型建模的预测精度。