论文部分内容阅读
半参数回归模型是二十世纪八十年代发展起来的一种重要的统计模型.这种模型既含有参数分量,又含有非参数分量,它可以概括和描述众多实际问题,比单纯的参数和非参数回归模型更接近于实际,更能充分利用数据中提供的信息.兼顾了参数回归模型和非参数回归模型的优点,比单纯的参数回归模型或非参数回归模型有更大的适应性,并具有很强的解释能力.
由于纵向数据在生物学和经济学中有着广泛的应用,因而近年来对纵向数据的研究已成为统计学上的热点课题之一.特别是国外统计学者在这方面的工作尤为突出,在理论和应用上都得到了许多有用的结果.
纵向数据是指对每一个个体在不同时间进行观测而得到的由截面和时间序列融合在一起的数据.纵向数据的最大特点就是将截面数据和时间序列数据结合在一起,既能分析出个体随时间变化的趋势,又能分析出总体的变化趋势.由于同一个体在不同时间进行重复观测,而且个体间又存在一定的差异.从不同个体间获得的观测值是独立的,而对同一个体的重复观测值是相关的.从而导致了对纵向数据建模时协方差结构的复杂性.
考虑如下的纵向数据半参数回归模型:Yij=XTijβ+g(Tij)+εij,i=1,…,n,j=1,…,m,其中Yij和(Xij,Tij)是第i个个体第j次观测的响应变量和协变量,(Xij,Tij)∈RP×[0,1]是随机变量,β是p维未知回归参数,g(·)是未知光滑函数,εij是均值为0且方差有限的随机误差,εij与(Xij,Tij)相互独立,从不同个体间获得的观测值是独立的,而对同一个体的重复观测值是相关的.
本文在纵向数据下研究了半参数回归模型中参数分量和非参数分量的估计及其大样本性质.对非参数分量采用局部线性拟合的方法来逼近,该方法比通常流行的核方法有很好的性质.对参数分量的估计分别采用了最小二乘估计和Profile加权最小二乘估计方法.在适当条件下分别给出了这些估计量的相合性和渐近正态性.最后,采用交叉核实准则选择光滑参数.通过蒙特卡洛模拟研究表明了,在有限样本情况下,Profile加权最小二乘局部线性拟合方法比最小二乘局部线性拟合方法有较好的性质.