论文部分内容阅读
偏最小二乘法(PLS)是构造回归方程的一种较新的多元统计方法,最早由化学界的S.Wold在1983年提出,后来日益受到统计界的关注。许多统计学家都对这种方法进行了研究。这种方法不但可以用于单变量的回归分析,而且可以用于多元变量回归分析。其中,偏最小二乘回归相当于普通线性回归、主成分分析、典型相关分析的组合,即(PLS≈多元线性回归+主成分分析+典型相关分析)。当数据中存在共线性,或样本容量小于自变量个数时,构造新的解释变量,对新的解释变量使用最小二乘(OLS)来确定因变量与自变量间的回归方程。PLS构造新解释变量的目的是,使构造的新解释变量包含自变量最大的信息,消除数据中共线性的影响,利于对因变量的预测,同时,通过使用比自变量个数少的成分来降低回归问题的维度。本文在总结多元线性回归模型基础上,进一步认识到其存在的多重共线性问题,提出用偏最小二乘回归模型定义:从多元线性回归、主成分分析以及典型相关分析相结合三个层面上提出了偏最小二乘回归模型。从理论和实证方面证明偏最小二乘回归模型更科学、合理;在论文最后一章中运用偏最小二乘回归方法,分析了影响黑龙江省消费水平的4个因素,研究表明了2000年以来,黑龙江省的消费能力与物价,就业人数作用明显。基于文章中的分析结论,黑龙江省的消费水平的增高取决于要解决好人员就业等问题。另外,将成分数据的对称logratio变换方法与PLS(偏最小二乘)回归相结合,提出在因变量是成分数据,自变量也是成分数据的情况下,建立了线形回归模型的方法。该模型方法可以满足成分数据的定和约束,克服成分数据中完全多重共线性对模型的不良影响,并且突出成分数据主题含义在建模中的作用和意义。根据提出的新方法,建立了中国就业结构模型。