论文部分内容阅读
数据缺失问题普遍存在于实际生活中,如在市场调查、人口普查、可靠性寿命试验、飞行参数记录系统等实际数据处理中,它给数据分析与应用带来很多困难.由于某些不可控或人为失误的原因,容易产生大量缺失数据.经典的许多统计模型和统计方法都适用于完全数据,对缺失数据情形下的统计研究相对较少.因此缺失数据情形下的统计推断引起了统计学家和实际应用工作者的极大兴趣,并成为统计的一个热门研究领域(Little与Rubin(2002))事实上,在有数据缺失的情况下,需要对数据进行必要的预处理后才可以.目前,处理缺失数据通常采用填补方法,对原有数据进行填补,继而得到“完全样本”,再按完全数据方法进行统计推断.本论文主要研究缺失数据情形下估计方程的经验似然推断.对完全数据下估计方程的研究,比较成熟的方法是Qin与Lawless(1994)经验似然方法.该方法首先构造了参数的经验似然比函数,并在零假设下证明了该经验似然比检验函数的极限分布为卡方分布.对随机缺失机制下估计方程的研究,比较经典的方法是Wang与Chen(2009)的非参数填补方法.但他们的方法在零假设成立时检验统计量的极限分布为加权卡方分布,在实际应用中存在需要估计调整系数等不足.针对他们的不足,本论文采用逆概率权填补法得到“完全样本”,在此基础上构造了估计方程中感兴趣参数的经验似然比函数.利用此函数可以得到参数θ的极大似然估计,在一定正则条件下证明此估计具有渐近正态性;进而利用经验似然函数在检验H0:θ=θ0时(θ0为完全已知)的检验统计量在零假设下是渐近χ2(r)(其中r为估计方程的个数).由此可以借助χ2(r)分布给出参数θ的置信区间(域).针对前述具体情况,我们还做了模拟研究.模拟结果显示,在小样本下,本方法构造的置信区间具有较好的覆盖概率.在相同的水平和容量下,我们的方法所得的覆盖概率稍好于Wang与Chen(2009)覆盖概率.同时,区间长度也随着样本容量的增加而逐渐减小.本文的特色主要体现在以下两个方面:1.将Wang与Chen (2009)中的条件减弱(主要体现在扩大核估计的适用范围),扩大了模型的适用范围.2.在讨论数据缺失情形时估计方程模型中感兴趣参数的经验似然置信区间(域)的构造时,采用了逆概率权填补法,证明基于此填补法得到的经验似然比函数的极限分布为卡方分布.从而说明利用此结果构造估计方程中感兴趣参数的经验似然置信区间(域)时不需要调整,可以提高经验似然置信区间(域)的覆盖精度.