论文部分内容阅读
偏最小二乘回归(partial least squares regression,PLSR)作为一种基于因子分析的多变量校正方法,近年来广泛应用于化学、化工、经济、环境、食品、教育心理等领域。本文以PLSR方法的功能拓展和实际应用为主线,针对化学化工问题及其样本数据所具有的时变性、非线性、存在离群点及多因变量等特征,提出了拓展和改进PLSR功能的几个关键问题,使其能适应上述特性,满足实际需要,分别设计了加权分块递归偏最小二乘、模糊逻辑偏最小二乘、快速稳健偏最小二乘和基于极小极大估计的多因变量偏最小二乘等方法,并将这些方法应用于化学物质结构与性质间关系、化工生产过程等实际问题建模,效果显著。全文的主要内容可归结为以下五个部分,其中包括了研究工作所取得的主要成果。 1、系统回顾了偏最小二乘方法的发展历史、研究现状及应用领域;阐述偏最小二乘方法的基本原理及基本性质;简要介绍了偏最小二乘方法的诸多辅助分析技术。 2、为满足PLSR方法适于时变数据建模的要求,推导与构建了加权分块递归偏最小二乘回归方法。该方法基于相关多变量时变样本数据,采用偏最小二乘方法,以分块递归的方式,为过程变量建立软测量模型,并在分析时变数据特性的基础上,引入样本加权策略,以使模型具有跟踪过程变化的能力,同时提出选定加权函数相关参数的方法和步骤。将该法实际应用于某公司PTA装置溶剂脱水塔,为塔釜排出液H2O含量建立软测量模型,与已有方法相比,它提高了建模效率,改进了模型预测性能,从而对确保生产过程稳定,有效控制产品质量具有重要意义。 3、提出模糊偏最小二乘(fuzzy PLS,FPLS)算法的新方案。该算法针对化学化工数据的非线性及PLS成分对的单输入单输出特性而构建的,同时它可克服高维变量系统模糊建模引起的规则“组合爆炸”以及变量间的耦合关系导致模型泛化能力较弱。其中成对PLS成分间的模糊模型,按因变量成分随自变量成分的变化剧烈程度(幅度和频度)和逼近精度要求自适应确定模糊规则总数和规则前件参数,由最小二乘方法确定规则后件参数。为更好实现每对成分间