论文部分内容阅读
统计过程控制通过监控和优化生产过程从而保障产品质量的重要途径。通过对过程数据的多变量统计分析,依赖概率论和数理统计等技术,可以从大量过程变量的变化中提取影响产品质量的主要因素,为进一步提高产品质量和过程能力提供理论依据。统计过程控制,因其概念简单并且通用性很强,近几年在过程建模、数据分析、数据挖掘、特征提取、过程监控等方面得到了大力的发展。多变量统计分析主要基本方法包括主元分析、偏最小二乘回归、主元回归等。由于在实际的生产过程中,变量间普遍存在着非线性关系,因此基于非线性多变量统计分析方法成为了众多研究领域的热点问题。基于核主元分析、核偏最小二乘回归算法,过程模型时,需要考虑模型内部参数对其的影响。为此,针对非线性过程中的过程统计模型,本论文提出了若干估计模型参数的方法,具体研究内容包括:(1)针对核主元分析模型中确定主元个数的估计问题,分析了累计方差贡献率、重构误差、核平行分析等方法在确定主元个数上的优劣性,并提出了一种最优估计核主元分析算法中主元个数的二维交叉验证的方法。即首先移除数据集中的一个变量,利用剩余变量集对所移除变量进行预测。同时,推导了相应的核主元回归模型。通过最小化预测误差平方和的方法来确定模型的最佳主元个数。最后,通过一个仿真例子和三个工业实际过程数据,并与现有方法进行对比,证明了所提出方法在估计主元个数的正确性。(2)针对目前受到关注的数据结构检测问题,首次提出利用核主元分析算法中的核主元提取过程信息,并进行潜在非线性数据结构检测的方法。此方法首先需要将数据集中的变量进行分类,并分别估计出每个子变量集合的核主元个数,再利用二维交叉验证的方法,利用每个变量集中估计出的核主元进行“小组预测”,通过变量集中每个变量的预测误差判定两组变量集是否含有共同的驱动信号。最后,通过一个仿真例子(已知变量分类)和三个过程数据(未知变量分类)来验证所提出方法对数据结构检测的有效性。(3)针对目前大部分方法估计核主元算法、核偏最小二乘算法中无法同时估计潜变量个数和核参数的问题,分别提出了一种同时估计这两个模型参数的方法。通过一个仿真实例,分析了所提出算法性能对数据分段数、样本个数的敏感性。同时,通过对不同的样本数、分段数的仿真,得到了其对最优参数影响的一些结论。最后,将此方法应用于三个实际过程对象,并且与现有方法进行了模型预测精度上的对比,仿真结果验证了此方法对估计模型参数的合理性和最优性。