论文部分内容阅读
包络是一种相对比较新的降维方法,用于减少相对于多元统计中标准方法的估计和预测变化,有时相当于将样本量增加许多倍.本质上,包络是一种源自充分降维的目标降维形式,它继承了Fisher充分统计概念的基本原理.通过使用降维技术移除数据中不重要的变量,包络模型可以获得估计的有效性并提高预测效率.当包络子空间等于全空间时,包络模型退化为标准模型,但是只要感兴趣的预测变量的维数小于响应变量的维数,部分包络模型仍然适用,所以部分包络模型比包络模型更灵活.我们吸取部分包络模型的降维思想去关注某些特别感兴趣的预测变量并设置更宽松的限制条件,从而可以进一步提高参数估计效率并进行有效降维.本文重点研究了降秩部分包络模型、逐群部分包络模型、标度部分包络模型以及同时部分包络模型下多元参数的有效估计和响应变量降维问题.主要包括如下内容:(1)研究了降秩部分包络模型在多元线性回归中的有效估计.为了进一步提高参数估计的有效性并减少估计参数的数量,我们将部分包络和降秩回归进行结合形成降秩部分包络模型,该模型可以有效地进行参数估计和降维,并且比部分包络模型和降秩回归模型表现得更好.进一步,我们给出了降秩部分包络模型参数的最大似然估计量以及在正态分布下的渐近分布和理论性质.同时,我们也给出了秩和部分包络维数的选择方法.最后,在正态误差和非正态误差分布下,我们实施模拟研究将提出的降秩部分包络模型与普通最小二乘法、降秩回归模型、部分包络模型和降秩包络模型进行比较.实际数据分析也支持了我们的理论阐述.经过大量的模拟研究和实际数据分析,降秩部分包络估计量展示出良好的表现.(2)研究了逐群部分包络模型在多元线性回归中的有效估计.为了包含不同群的群信息,我们将部分包络延伸到逐群部分包络.它不仅可以提高参数估计的效率,而且可以扩大部分包络模型的使用范围.逐群部分包络模型保留了原始部分包络方法提高有效性的优点,并且允许不同的群拥有不同的回归系数和不同的误差结构.接着,我们给出了逐群部分包络模型下的最大似然估计.同时,我们也给出了逐群部分包络估计量的渐近分布和理论性质.最后,我们实施模拟研究将提出的逐群部分包络模型与标准模型、部分包络模型和分离部分包络模型进行比较.从模拟结果和实际数据分析可以看出,逐群部分包络估计量的表现远优于标准模型估计量、部分包络估计量和分离部分包络估计量.(3)研究了多元线性回归中的标度部分包络模型.部分包络模型的推断在响应变量重新标度下是变化的或非等变化的,并且部分包络模型的使用限制在以相同或类似单位测量的响应变量中.当响应变量以不同的尺度测量时,部分包络所承诺的有效性获得通常无法实现.为了克服上述缺点并扩大部分包络的使用范围,我们提出了标度部分包络模型.它保持了部分包络模型增加有效性的优势,并且对于标度变化是不变的.进一步,我们给出了标度部分包络模型参数的最大似然估计量以及标度部分包络估计量的理论性质.最后,通过与标准模型估计量、部分包络估计量和标度包络估计量进行比较,模拟研究和实际数据例子展示了标度部分包络估计量的优势.(4)研究了多元线性回归中的同时部分包络模型.我们的目标是通过同时减少特别感兴趣的预测变量X1和响应变量Y来减少预测和估计变化,从而将它们的优势联系起来.首先,我们提出了同时部分包络模型,该模型可以显著提高参数估计的效率并可以有效降维.进一步,我们给出了同时部分包络模型参数的最大似然估计量.同时,我们也给出了同时部分包络估计量的渐近分布和理论性质以及秩和包络维数的选择方法.最后,模拟研究和实际数据分析表明同时部分包络估计量的表现远优于普通最小二乘估计量、X1-包络估计量、Y-包络估计量和同时包络估计量.