论文部分内容阅读
模型平均是统计学和计量经济学研究的热点问题,不仅有很多学者对其进行理论研究,而且也被广泛的应用于生物医学、经济金融、环境学等领域。然而已有的针对模型平均方法的研究通常是建立在简单的线性模型上的,而关于复杂模型的研究相对较少。而实际中,随着科技的发展,统计学家需要分析和处理的数据越来越复杂,简单的线性模型已经不能满足分析的需求,因此考虑采用更加复杂的模型来进行建模和分析,以期得到更好的预测效果是一个必然的发展趋势。本文研究的即是非参数与半参数模型平均的理论与方法,主要内容包括:(1)对非参数模型,提出了基于删一交叉验证的权重选取准则,证明了加权窗宽对应的估计量在平方损失的意义下是渐近最优的,即可渐近地达到最小的平方损失,避免了窗宽选择这一经典难题;(2)对变系数部分线性模型,考虑了两种不同的模型不确定性,在不必事先假定自变量的系数的类型下,仍然能够得到较好的预测结果,针对该模型,提出了一个Mallows类型的权重选取准则,并证明了加权估计量的渐近最优性;(3)对于部分函数线性模型,先利用了传统的谱分解的方法来处理函数型变量的协方差函数,以线性化该模型,再利用Mallows准则的思想进行模型平均,并证明了模型平均估计量的渐近最优性;(4)基于Hjort和Claeskens (2003)局部误设定的框架,将参数模型下的模型平均估计量的渐近理论扩展到一般的半参数模型,推导了估计的渐近分布及置信区间,极大地拓宽了模型平均的适用范围。(5)另外,也研究了不等式约束下的线性模型和多因变量模型这两种复杂模型的模型平均方法,分别提出了基于删组的J折交叉验证和基于马氏距离的权重选取准则,并证明了模型平均估计量的渐近最优性,还在一定条件下证明了不等式约束正确时的模型的最优权重之和依概率趋于1,克服了参数之间有约束以及因变量之间有相关性给实施模型平均方法带来的困扰。 此外,本文对每一项研究都做了大量的模拟验证和实例分析,如对加州圣地亚哥36个疗养院的数据、我国77个少数民族地区的数据、波士顿郊区房价数据、肉类和玉米样本的光谱数据等进行分析和预测,表明我们提出的方法相较于其他常用的模型平均和模型选择方法是更有效的。