论文部分内容阅读
【摘 要】 非抽样误差的产生贯穿了调查的每一个环节,任何一个环节出错都有可能导致非抽样误差增加而使数据失真,我们平时说的控制误差主要指的就是控制非抽样误差。我们以Johan Fosen等在《在挪威的移民中不答复随访对生活状况调查的影响》为例,研究如何控制非抽样误差。
【关键词】 后续 加权 效率
一、研究内容
在调查的数据收集过程结束时,我们有时会面对是否延长的问题,
数据收集期间这个额外的数据收集期通常被称为第二波收集或后续,目的通常是减少无应答偏差,但是有时只是为了增加净样本。在移民生活状况调查中,在2006年进行的2006年挪威调查,必须考虑这些因素。
民生活状况调查原定于6月1日结束数据收集,但是,由于答复率低至54%,而计划答复率为70%,决定延长数据收集期,进行后续或第二次波数据收集。以前的其它调查研究表明:随访可能会减少偏见,这也是我们在这次调查中所希望的。因此,问题在于后续努力是否得到了回报。
二、研究方法
我们将研究用更先进的估计方法取代后续的效果。我们将迟到的受访者加权并使用Bartholomew(1961)描述的程序的方法,此外,我们还将考虑使用两种后续方法的效果和成本效率和后期受访者加权。
我们假设非受访者等于第二波受访者,预测未受访者之间的平均值与第二波的平均值相同,这个权重与简单平均值不同,只是受到迟到的假设,因此它会每当假设失败时,执行比简单平均值更差的操作。
通过简单的平均值估算结果的调查中,我们将比较对后续结果的影响的非答复者,并根据最后10%的答复者进行加权,收集所使用的数据2006年挪威移民生活状况调查。
我们通过将最后的10%受访者定义为“最近的受访者”来实施迟到受访者权重。然后,我们可以使用后续受访者加权和无后续加权。这导致四个替代结果显示在该表的四列中。
该表告诉我们,对于“在挪威生活的年份”和“孤独感”的变量,后续方案只会导致估计值的微小变化,更重要的是可能会有相同的结果。通过加权方案。 由于加权方案选择更便宜,这一点如果我们只能就这两个变量作出结论,那么选择似乎更可取。
对于“感知健康”,情况与其他两个变量不同。也许最有趣的功能是后来的答复者只是随访结果与结果(2.25对2.24)几乎没有区别。在没有跟进的情况下,权重会降低估计值,但在完成后增加估计值跟进。这意味着之前跟進的受访者与我们获得的最后一个受访者不同在后续过程中。在这两种情况中的一种情况下,加权背后的假设显然不是保持。我们可以看到:平均值并不单调地增加或减少真实值,而是在一定程度上上升间隔并在其他地方下降。在我们选择使用迟到的权重之前,我们应该确保平均值是单调的。省略这个第一部分的原因是我们在这里之前预计平均值的变化是由随机性引起的,因此出现了上述情况。
三、结论
我们的研究结果似乎表明,在本次调查中,通过做第二次调查,只能取得略微的进步,我们只调查了收集到的所有变量的一小部分。此外,结果在很大程度上是针对小组发布的。在总净样本中平均,这些效应可能在子组中不同,因此我们没有足够的经验基础来说明第二波应该已经下降。这可以扩展并用于决定是否应该执行第二次波浪数据收集。
有时过期的受访者权重可以作为改善结果的廉价方式,有时也是如此完全如同第二次调查一样,迟到的被访者的假设有时不会成立,因此应该谨慎使用这种加权方法。
附录
Johan Fosen, Gustav Haraldsen, and ?yvin Kleven,Proceedings of Statistics Canada Symposium 2008,The Effect of Non-response Follow-up in a Survey on Living Conditions among Immigrants in Norway.
作者简介:李晓红(1994—),女,汉,河北省石家庄市人,统计学硕士,单位:天津财经大学研究生院统计学专业,研究方向:国民经济统计分析。
【关键词】 后续 加权 效率
一、研究内容
在调查的数据收集过程结束时,我们有时会面对是否延长的问题,
数据收集期间这个额外的数据收集期通常被称为第二波收集或后续,目的通常是减少无应答偏差,但是有时只是为了增加净样本。在移民生活状况调查中,在2006年进行的2006年挪威调查,必须考虑这些因素。
民生活状况调查原定于6月1日结束数据收集,但是,由于答复率低至54%,而计划答复率为70%,决定延长数据收集期,进行后续或第二次波数据收集。以前的其它调查研究表明:随访可能会减少偏见,这也是我们在这次调查中所希望的。因此,问题在于后续努力是否得到了回报。
二、研究方法
我们将研究用更先进的估计方法取代后续的效果。我们将迟到的受访者加权并使用Bartholomew(1961)描述的程序的方法,此外,我们还将考虑使用两种后续方法的效果和成本效率和后期受访者加权。
我们假设非受访者等于第二波受访者,预测未受访者之间的平均值与第二波的平均值相同,这个权重与简单平均值不同,只是受到迟到的假设,因此它会每当假设失败时,执行比简单平均值更差的操作。
通过简单的平均值估算结果的调查中,我们将比较对后续结果的影响的非答复者,并根据最后10%的答复者进行加权,收集所使用的数据2006年挪威移民生活状况调查。
我们通过将最后的10%受访者定义为“最近的受访者”来实施迟到受访者权重。然后,我们可以使用后续受访者加权和无后续加权。这导致四个替代结果显示在该表的四列中。
该表告诉我们,对于“在挪威生活的年份”和“孤独感”的变量,后续方案只会导致估计值的微小变化,更重要的是可能会有相同的结果。通过加权方案。 由于加权方案选择更便宜,这一点如果我们只能就这两个变量作出结论,那么选择似乎更可取。
对于“感知健康”,情况与其他两个变量不同。也许最有趣的功能是后来的答复者只是随访结果与结果(2.25对2.24)几乎没有区别。在没有跟进的情况下,权重会降低估计值,但在完成后增加估计值跟进。这意味着之前跟進的受访者与我们获得的最后一个受访者不同在后续过程中。在这两种情况中的一种情况下,加权背后的假设显然不是保持。我们可以看到:平均值并不单调地增加或减少真实值,而是在一定程度上上升间隔并在其他地方下降。在我们选择使用迟到的权重之前,我们应该确保平均值是单调的。省略这个第一部分的原因是我们在这里之前预计平均值的变化是由随机性引起的,因此出现了上述情况。
三、结论
我们的研究结果似乎表明,在本次调查中,通过做第二次调查,只能取得略微的进步,我们只调查了收集到的所有变量的一小部分。此外,结果在很大程度上是针对小组发布的。在总净样本中平均,这些效应可能在子组中不同,因此我们没有足够的经验基础来说明第二波应该已经下降。这可以扩展并用于决定是否应该执行第二次波浪数据收集。
有时过期的受访者权重可以作为改善结果的廉价方式,有时也是如此完全如同第二次调查一样,迟到的被访者的假设有时不会成立,因此应该谨慎使用这种加权方法。
附录
Johan Fosen, Gustav Haraldsen, and ?yvin Kleven,Proceedings of Statistics Canada Symposium 2008,The Effect of Non-response Follow-up in a Survey on Living Conditions among Immigrants in Norway.
作者简介:李晓红(1994—),女,汉,河北省石家庄市人,统计学硕士,单位:天津财经大学研究生院统计学专业,研究方向:国民经济统计分析。