论文部分内容阅读
现实生活中,由于各种人为的或其它不可知的因素,往往会有大量缺失数据的产生.譬如在一些民意调查、市场研究等社会领域中,由于调查者不愿提供完整的数据,从而造成数据缺失,同样在医学诊断研究中也经常会出现数据缺失,因此,在实际应用中缺失数据问题越来越引起人们的关注。在现实中有着广泛应用背景的部分线性模型在缺失数据时的统计推断也就成为了研究的焦点。数据缺失时如果直接用通常的诊断方法往往会致使数据偏差增大及效率损失。在数据缺失的情况下,我们需要对数据进行必要的处理,处理带有缺失数据的不完全样本时可以对缺失值进行填补,继而得到“完全样本”,再按通常的方法进行统计推断。部分线性模型中的数据缺失包括响应变量的缺失以及协变量的缺失。响应变量缺失是最常见的数据缺失,已有大量文献对响应变量缺失情形下部分线性模型的统计推断进行了研究,并有了很好的研究成果,但协变量缺失情形下部分线性模型的统计推断还不是很完善。
本文将部分线性模型协变量缺失分成参数部分和非参数部分进行研究讨论,再运用非参数经验似然估计法以及加权经验似然估计法证明了所构造的参数服从卡方分布。文章首先讨论了响应变量缺失时部分线性模型的经验似然推断,通过运用多重插补法得到“完全样本”数据,然后再用EM算法和MCMC算法进行参数和非参数的估计,并运用经验似然法证明了估计的渐近正态性,并求出了渐近置信区间。接着讨论了协变量缺失时部分线性模型的经验似然推断,运用同样的方法得到“完全样本”数据,并通过构造经验似然比统计量,结合杨宜平[1]等的证明方法,证明了其极限分布为卡方分布。