基于模拟实验的缺失数据插补方法比较

来源 :北京师范大学 | 被引量 : 0次 | 上传用户:libowen1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在社会调查中,由于多方面的原因,经常会出现缺失数据。调查数据的缺失给统计分析带来了极大的不便,尤其是在缺失的比例很大的情况下,直接删除缺失值会造成严重的系统偏差,大大降低研究的精度。为了减少由缺失值带来的偏差,有必要对缺失值进行处理,其中常用的处理方法就是插补。本文以“西北基线户数据”为例,模拟产生缺失值,使缺失比例分别为10%、20%、30%、40%、50%、60%,在不同缺失比例下,分别用均值插补、回归插补、热平台插补和多重插补对缺失变量进行处理,比较这四种方法的优劣。最后得出结论:从数据分布特征及变量之间关系的稳定性来看,多重插补方法都是最为理想的方法,但是由于多重插补方法有其自身的复杂性,当缺失概率不大于10%时,完全可以采用简单易行的均值插补对缺失值进行处理;当缺失比例不大于30%时,则可以采用热平台插补或回归插补方法对缺失值进行处理;而当数据缺失比例大于30%时,多重插补是有效处理缺失值的最优选择。
其他文献
劳动力流动作为劳动力市场优化资源配置功能的实现方式,一直都是劳动经济学研究的重点之一。20世纪80年代以来,劳动经济学更加关注工人个体的供给行为,劳动力流动的研究重点
二氧化硫是大气污染物主要成分之一,各大供暖企业采用不同手段去除烟气中的二氧化硫,近些年湿式镁法烟气脱硫技术日趋成熟,工艺设备简单,运行操作方便灵活,投资费用低,优势明
学位
安装避雷器是配电线路有效防雷措施,需要合理研究降低线路避雷器雷击损坏概率对策以延长避雷器运行寿命.采用EMTP软件建立10 kV线路模型,计算线路遭受雷电直击或雷电感应时避
本研究从实证的角度出发,对2001—2007年来教育经济与管理专业硕士学位论文进行内容分析,从研究主题、研究方法、统计分析方法、调查对象、研究教育阶段、研究视角、参考文献
乡村拥有着丰富的农业产业与乡村文化资源,设计助力乡村产业发展是一个系统工程.本文从农业装备智能化、乡村文化创新转化、品牌重塑等方面,结合案例展开了分析,并强调了协同
配电线路雷击闪络率作为线路跳闸、断线等故障的前提,能够对线路可能引起的跳闸、线路断线等故障风险做初步评判,可有效表征配电线路耐雷性能.目前,对于配电线路受雷宽度的计
令世人国人瞩目的中国共产党第十五次代表大会在收获的金秋时节胜利召开,她又带着满获丰收的喜悦胜利地闭幕了。她是5800多万中国共产党员的盛事,也是中国各民主党派和全国
在向市场经济转型过程中,我国逐步使用市场手段和契约手段来调整劳动关系双方的关系,劳动关系逐渐向角色清晰的契约化关系方向发展。随着改革开放的不断深入,经济结构的调整
我国的学校社会工作是一门引入不久的新兴专业。纵观学校社会工作在我国开展的实际状况,相比于美英等发达国家和地区,我国的学校社会工作尚处于探索和发展阶段,即专业化的学