论文部分内容阅读
缺失数据的问题在现实生活中是普遍存在的,比如在市场调研、医学研究中都会出现,导致我们收集到的数据是不完全的,而传统的统计方法是不能直接应用到数据存在缺失的样本上,所以有必要对数据进行处理,常用的办法是对缺失的数据进行填补,在得到完全数据后,在利用统计方法推断。当今统计界对缺失数据的研究依然是是一个很热门的领域。在缺失数据的回归模型研究中,取得了很多优秀的成果。Cheng(1994)[1]利用非参数和回归填补得到“完全样本”并给出了响应变量均值的渐近正态性和渐近方差的相合估计。Wang and Rao(2001)[2]利用固定补足得到“完全样本”在线性模型回归系数的经验似然置信域。邱涛(2010)[4]利用逆概率加权的办法构造了x=x0,x∈Rp条件下,经验似然比统计量的极限分布,构造的m(x0)的经验似然置信域不需要调整,有很好的精度。 本文在第二章,假设在MAR缺失机制下,利用均值来插补缺失的数据,得到了一个完全样本,并定义了EY的经验似然比统计量,证明了其的极限分布,创新之处在于构造的经验似然比统计量满足条件x=x0,x∈Rp,用此结果构造m(x0)的经验似然置信域时,不需要调整,提高了置信区间的精度.第三章给出了当协变量缺失时,在线性回归模型中,利用逆概率加权填补法,得到了一个“完全数据”,构造了参数β的渐近分布,利用此结果构造参数的置信域,得到了较好的结果。