论文部分内容阅读
在抽样调查中,无回答现象常常导致调查估计量产生无回答偏差。无回答偏差与无回答率有关,还与被调查者的回答可能性有关。国内外学者对无回答的处理已经有很多的研究。处理无回答的最好方法是预防无回答的产生,在抽样设计阶段所采取的提高回答率的措施和提高回答可能性的措施都能使无回答偏差减小,但不能避免无回答偏差。对项目无回答偏差的修正方法主要是插补法,目前已有很多相关文献。对于单元无回答的解决方法,Hansen and Hurwitz (1946)最早提出对无回答层进行子抽样(subsampling),并利用为分层而进行的二重抽样的估计方法来估计总体均值。本文总结了不同情况下的单元无回答的二重抽样及相关估计方法。特别是,模拟了Khare, Pandey and Srivastava (2011)提出的无回答二重抽样的两类估计量相对于Hansen and Hurwitz(1946)估计量的相对效率,并与Khare and Srivastava (1993)和Khare (1992)提出的无回答二重抽样估计量的相对效率进行了比较。模拟结果显示,基于总体信息时,这两类估计量的均方误差较小,较有优势;进一步,本文对基于样本信息对估计量的均方误差进行模拟研究,模拟结果显示,这两类估计量的均方误差反而要大一些,不再具有优势。通过对估计量的基于总体信息和样本信息得到的均方误差的差异原因进行分析,发现当无回答是随机缺失时,对于第一类估计量,无回答层目标变量与辅助变量的样本协方差对均方误差的影响较大,对于第二类估计量,目标变量的总体均值的估计值对均方误差影响较大。当无回答非随机缺失时,对于这两类变量,对均方误差影响较大的因素都是总体中目标变量与辅助变量的样本协方差。