论文部分内容阅读
近年来,由于缺失数据在实际领域中有很强的应用背景,诸如生存分析、可靠性寿命试验、医药追踪试验中产生大量不完全数据等。因此,对缺失数据的统计性质以及缺失数据下的回归问题进行讨论具有很重要的实际意义。而非参数回归模型在完全数据下的统计性质已经发展得较为完善,相对而言,基于缺失数据下的统计性质的分析是一个历史不长、逐步发展的领域。
本文在缺失响应变量的情况下,对非参数回归模型进行研究。利用变窗宽局部线性平滑法和稳健的变窗宽局部M—估计法给出了回归函数m(x)的估计。利用变窗宽提高了估计的可塑性,使之更灵活,利用M—估计既继承了线性平滑法的优点,又克服了最小二乘方法缺少稳健性的缺点。
而在处理缺失数据问题时,本文采用两种方法:一是成对删除法,即把Yi缺失的数据成对删除,利用剩余数据进行非参数回归,称其为简单法,这是实际中最常用韵方法。二是两阶段估计法,由Yates(1933)以最小二乘估计值代替缺失数据值思想启发,利用简单法得到的估计值代替缺失的Yi值,从而形成一个完整数据集,用此数据集进行非参数回归,称其为估算法。
文章将分别用变窗宽局部线性平滑法和稳健的变窗宽局部M—估计法按上述两种方法处理缺失数据,得到相应的估计函数,并给出它们的渐近均方误差(AMSE)表达式。通过渐近均方误差(AMSE),可看出核函数和窗宽对估计的作用,并且可以利用最优渐近均方误差比较简单法和估算法,进而得到结论:估算法中,若两个阶段的窗宽不同阶,则简单法优于估算法;若两个阶段的窗宽同阶,当选取适当的核函数时,可得到估算法优于简单法。这样就给实际中处理缺失数据带来一种更好的方法,即两阶段估计法。