论文部分内容阅读
在抽样调查中,参数统计量的方差估计是统计分析中的重要一环。当存在缺失数据时,如何进行插补方差估计引起了众多学者的广泛关注。因此产生了多种插补方差估计的方法,如多重插补法以及重抽样法(刀切法、BRR法、自助法)。这些研究提供了单个方法的理论基础或者部分方法的对比,但往往是在很强的假设条件下,未必适用于实际应用。本文从实际应用的角度,基于分层抽样数据的模拟实验,系统全面的比较了各种插补方差估计的方法。文中不仅考虑到不同的缺失机制(MCAR、MAR、NMAR)、不同的缺失比例,还从不同的插补数据方法(随机热卡插补、ABB插补、均值插补)以及不同的插补次数的角度,利用计算机编程进行大量重复模拟实验来观察和比较各种插补方差估计方法在实际应用中的效果,包括准确性与稳定性,并且提供了各方法在实际应用中备选的次序,对于往后的插补方差估计工作与研究具有很好的参考意义。
本文主要结论总结如下:
1.在MCAR缺失机制下,综合考虑准确性与估计效率,插补次数较多的ABB多重插补方差估计通常是较好的选择。当缺失比例较低时,随机热卡多重插补的准确性与稳定性也比较好;当缺失比例较高时,重抽样插补法的效果相对较好,除了BRR随机热卡插补法。
2.在MAR缺失机制下,综合考虑准确性与估计效率,插补次数较多的ABB多重插补法或者是均值插补下的刀切法会是较好的选择。当缺失比例较高时,重抽样插补法的效果相对较好,但BRR均值插补法除外。
3.在NMAR缺失机制下,多重插补法不是一个很好的备选方法。综合考虑准确性与估计效率,均值插补下的刀切法总是最好的选择,方差估计值准确性高,估计效率高;在缺失比例较小时,还可以考虑随机热卡插补下的刀切法;当缺失比例较高时,自助法均值插补与BRR法也可以列入考虑。
本文共分为六章,具体内容如下:
第1章为导论。本章首先说明了本文的研究目的与选题意义,然后简要阐述了国内外相关文献的研究成果,最后表明了本文的研究方法、框架及特色。
第2章为模拟实验与比较分析的基本思想与相关理论。本章归纳介绍了模拟实验中的两类插补方差估计方法:多重插补与重抽样方法(刀切法、BRR法和自助法),三种插补数据方法:随机热卡插补、ABB插补、均值插补,三种缺失机制:完全随机缺失、随机缺失、不可忽略缺失,以及不同的缺失比例与插补次数的选取。
第3章为完全随机缺失机制下的模拟实验与分析。本章首先介绍了实验数据的来源与选取,然后在完全随机缺失机制下,基于分层抽样数据,分析与比较了各种插补方差估计方法的准确性与稳定性。
第4章为随机缺失机制下的模拟实验与分析。本章主要在随机缺失机制下,基于分层抽样数据,分析与比较了各种插补方差估计方法的准确性与稳定性。
第5章为不可忽略缺失机制下的模拟实验与分析。本章主要在不可忽略缺失机制下,基于分层抽样数据,分析与比较了各种插补方差估计方法的准确性与稳定性。
第6章为综合评价。本章是全文的总结,提供了不同缺失机制下各方法的优点与缺点,给出具有参考价值的建议,并指出本文在研究中的不足以及以后的研究方向。