论文部分内容阅读
在经典的回归模型中,通常假设被解释变量之间是相互独立的.然而,在经济学、生物学、气象学以及地质学等诸多领域中,所收集的相邻数据之间往往存在一定的空间相依性.如果忽略这种相依性进行统计推断可能会产生严重的偏倚结果.因此在空间相依性存在的情况下,经典的回归模型不再适用.空间自回归(spatial autoregressive,SAR)模型由于充分考虑了数据之间可能存在的空间相依性,故能更好地刻画变量之间的数量关系.目前对于SAR模型的理论研究已取得了重要的成果,但在缺失数据、带测量误差数据等方面的理论研究还很少.随着近年来计算机技术的迅猛发展,关于空间相依数据的分析越来越受到统计界和相关应用领域的关注.另外,由于经典回归模型只是SAR模型的特例,这表明很多建立在经典回归模型的理论方法在SAR模型中不一定成立.因此,对于SAR模型在缺失数据、带测量误差数据等方面的理论研究具有一定挑战和意义.据此,本文对以下几个方面进行研究.(1)对部分线性变系数 SAR(partially linear varying-coefficient SAR,PLVC-SAR)模型和部分线性可加 SAR(partially linear additive SAR,PLADSAR)模型在参数先验信息满足一定约束条件下,通过使用sieve方法、两阶段最小二乘(two-stage least square,2SLS)估计法以及拉格朗日乘子法给出约束条件下的参数估计量和非参数估计量,并证明所给估计量的渐近性质.此外,还对参数的约束条件进行了假设检验,分别在PLVCSAR模型和PLADSAR模型下构造相应的检验统计量,并在原假设成立下证明了所构造检验统计量均渐近服从标准的卡方分布.模拟研究结果验证了所提估计量和检验统计量是有效性的.此外,所提的估计方法还被应用于一个实际例子分析中.(2)对于半参数变系数SAR模型,基于经验似然的理论下分别构造参数部分和非参数部分的经验似然比函数,然后给出最大经验似然估计量,并证明所给估计量的渐近正态性.此外,还证明了参数对数经验似然比和非参数残差调整的对数经验似然比均渐近服从标准的卡方分布,并给出了相应参数和非参数的置信域/置信带.模拟研究表明,最大经验似然估计具有很好的估计效果,且基于经验似然方法构造的置信域/置信带要优于基于正态方法.(3)对于半参数变系数SAR模型的参数维数随样本量增大而发散情况下,利用sieve方法逼近模型的非参函数,然后结合2SLS估计和SCAD(smoothly clipped absolute deviation)惩罚函数,提出了一种惩罚的sieve 2SLS估计方法.在一些假设条件下证明了所提估计量的Oracle性质.模拟研究表明所提出的惩罚估计方法在有限样本下具有很好的估计效果,且提出的估计方法被应用于真实数据分析中.(4)对于缺失数据下的SAR模型,通过结合逆概率加权和回归插补的方法,对线性的SAR模型提出了逆概率加权的插补2SLS估计及更新插补2SLS估计.在适当的条件下,证明了所提估计量的渐近正态性.此外,通过结合sieve方法,将所提出的估计方法和理论推广到PLVCSAR模型中.模拟研究和实际数据表明了所提估计量具有稳健的估计效果.(5)对于协变量带有测量误差的SAR模型,通过引入“Berkson型工具变量”和“经典型工具变量”,提出一种三阶段最小二乘(three-stage least squares,3SLS)估计方法.在一些假设条件下,证明了所提估计量分别在两种不同类型工具变量下的渐近正态性.模拟研究结果表明:无论工具变量是“Berkson型工具变量”还是“经典型工具变量”所提出的3SLS估计均表现出比较好的结果.