调查数据缺失值的多重插补研究

来源 :河北经贸大学 | 被引量 : 30次 | 上传用户:zhuobin0904
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
调查数据中的缺失数据问题普遍存在于抽样调查中,这些缺失数据影响后续统计分析,当今收集数据的技术和途径日益广泛,缺失数据的产生原因多样化,缺失数据成为当今抽样调查中不可避免的一部分。但缺失数据的存在增加统计分析难度,缺失数据会使有效数据减少,可获得的信息相应减少,影响统计量精度。由于不能充分表现总体信息,可能会导致统计推断出现偏差或无效,最终影响统计决策。随着人们研究问题的逐渐加深,传统的删除法和忽略法已经不能满足现实的需要。统计调查缺失数据问题的研究有重要应用价值。本文首先介绍了论文选题背景和研究意义,并对有关缺失数据研究作了简单文献描述;第2章介绍了缺失数据产生的原因及缺失数据的缺失机制和缺失模式,并详细介绍了均值插补法、回归插补法、EM算法、多重插补法等四种插补方法及其理论基础;第3章分别对单一变量随机缺失和多变量随机缺失进行了系统分析,在不同缺失率及不同抽样比条件下对四种插补方法的插补效果进行比较分析。给出四种插补方法的插补值偏差、均方误差及箱线图;第4章进行了基于模型的多重插补插补效果实证分析;以新农村建设满意度调查为背景材料,运用逻辑回归模型与多重插补相结合的方法进行实证分析,并探讨不同缺失率下的插补效果;第5章是全文总结及缺失数据处理方法研究工作进行展望。最终结果显示,缺失率增加,可用的样本数据所占比例减小,四种插补方法的插补值偏差逐渐加大。EM插补和多重插补两种方法在各缺失率下相对来讲都比较稳定,多重插补方法在中高缺失率下有较大的优势,运用逻辑回归模型与多重插补相结合的方法插补效果良好。
其他文献
人才流失是指在非企业主导或意愿下,人才的自愿离职,这种流出方式对企业来讲是不愿意看到的,不仅可能造成企业发展的临时困境,而且也会导致人工成本的大量损失,所以如何有效地保留
本文立足于吴语的区别性特征,从《汉语方言地图集》选取6幅方言地图,在对所涉语言项目的种种变异形式进行两分的概括后分别绘制出同言线地图,并将它们综合在一起,从而呈现出
沙伯基础创新塑料于2010年9月14至16日举行的美洲飞机内饰展(Aircraft Interiors Expo Americas)第1025号展位上宣布,公司推出一款采用高端Ultem*聚醚酰亚胺(PEI)树脂制造半结构式
美术比较是美术研究中的重要研究方法之一,尤其是在中、西方艺术研究中为国内外许多学者所采用。在美术作品间的图像分析中,比较研究成为研究中的基础工作和重要的工作。事实上
11月18日信易塑胶科技集团与东莞理工学院在信易华南东莞厂举办了“产学研合作揭牌仪式”。出席揭牌仪式的有:大朗镇副书记、镇长谢锦波,副镇长傅秩恩;东莞理工学院副校长戴炳
<正> 现在我们经济体制改革难度最大的是价格体系的改革。价格不合理的问题不解决,提高企业经济效益,增强企业活力的问题就无从谈起,理顺经济关系就成为空话。我们对此既不能掉以轻心,轻率行动;又不能犹豫不决,错过时机。五年内能不能过关,主要看这一条。广东在开放以后,在改革方面的承受能力加强了,特别是表现在价格改革上。广东这几年实行特殊政策,灵活措施,对物价管理逐步放开。放开以后,经历了“一放就活,一活就多,一多就稳”的过
7月29日下午,山东邹城市兖矿宾馆一号会议厅,高朋满座,气氛热烈,邹城市政府在此隆重举办生物材料产业园投资洽谈会,向来自深圳塑料行业的企业推介邹城市投资环境以及产业园的情况
西得乐,作为当今世界领先的整条瓶装生产线供应商之一,将于4月24日到30日参加在德国杜塞尔多夫举行的包装行业最大的展览会:德国国际包装机械、包装及糖果机械展(Jnterpack)。此次
以电池后盖板为CAE模拟分析模型,利用正交试验设计方法,将减小制品翘曲变形量作为优化目标,得到各工艺参数对制品翘曲变形量的影响程度及最优化工艺参数组合。利用径向基函数
以双螺杆挤出机制备了共聚PP/CaCO3高填充复合材料,表征了CaCO3粒子在基体中的分散行为,并对共聚PP及复合体系的流变行为进行了研究。结果表明:纯共聚PP的熔体呈现出明显的假塑性