完全随机缺失条件下连续型随机变量数据缺失插补方法的比较研究

来源 :中国卫生统计 | 被引量 : 0次 | 上传用户:qw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的探讨完全随机缺失条件下连续型随机变量数据缺失对研究结果的影响,对各方法插补效果进行比较。方法基于上海地区35岁及以上吸烟人群吸烟与肺癌死亡关系的完整数据集,在5%、10%、20%及30%缺失率下,模拟单变量(吸烟年数sy)缺失,采用了7种方法处理单变量缺失;模拟多变量(吸烟年数sy和每天吸烟支数smd)缺失,采用了4种方法处理多变量缺失。对插补效果从缺失变量均值的变化、插补精确性及插补后模型参数的变化三个方面进行评价。结果单变量缺失:各缺失率下,回归插补sy均值的偏差最小,MI/REG、MI/PMM和MI/MCMC插补后模型参数的偏差均较小,删除法sy均值与模型参数的偏差均最大。多变量缺失:各缺失率下,回归插补sy均值的偏差最小,删除法最大;条件均值插补smd均值的偏差最小,MI/MCMC最大;条件均值插补模型参数的偏差最小,MI/MCMC最大。结论用不同指标对各方法插补效果进行评价会得出不同的结果,应根据统计分析的目的和关注点选择最合适的缺失数据处理方法。总体来看,插补法处理缺失数据的效果优于删除法,缺失率越高,优势越显著。
其他文献
冰凌是冬季寒冷地区河流上普遍存在的一种水文现象。这些地区河流冬季常形成冰盖、冰塞或冰坝,它们会带来各种冰凌灾害。现在随着计算机技术的飞速发展,人们在研究冰水两相流
能使员工幸福的企业才能获得员工的认同,降低员工的离职率,提高员工工作积极性和创造性。员工的幸福管理对于提高组织的价值、提升个人的工作生活品质具有重要的积极意义。重
<正>现如今节能减排越来越受到社会的重视。建筑能耗占社会总能耗的28%,减少建筑能耗能有效缓解能源紧张、减少二氧化碳排放。我国既有的住宅建筑更是在建筑能耗中占了很大比
<正>近日发表在《科学报告》上的一则研究显示,酿酒酵母不同的遗传种群可以对葡萄酒的味道和香气产生影响。具有相同或者高度相似的遗传背景的作物在不同地区能产生具有独特
在简述帧中继网络的产生发展、应用特点以及组网方式地基础上,通过具体试验实例给出了基于Packet Tracer仿真环境实现帧中继网络连接和参数配置的方法,并利用Packet Tracer仿
运用文献资料法、实验法对17名偏瘦女大学生进行增肌运动处方锻炼.实验采用中低强度的有氧运动和抗阻练习,每次锻炼时间为40min,运动频率设定为每周2次(周一和周三),把心率控
随着金融全球化的发展趋势和金融危机的传染性不断加强,一国产生金融风险将会迅速的蔓延开来,影响到其他国家的金融稳定。从存款保险制度建立至今,存款保险制度得到越来越多
目的:观察曲马多复合地塞米松治疗硬膜外麻醉寒战反应的临床效果。方法:60例硬膜外麻醉寒战患者,随机分为Ⅰ组:曲马多2 mg/kg,地塞米松0.2 mg/kg;Ⅱ组:奈福泮0.3 mg/kg;Ⅲ组:
存货是企业重要的流动资产,存货的管理在企业的管理中占有非常重要的地位。近年来,许多企业都在存货的管理方面出现了大量的问题,因此存货管理也越来越受到重视。本文通过对
在回顾我国中学地理教材的编写历史、分析各时期教材主要得失的基础上,从剖析教材內容及其构成要素入手,对我国中学地理教材在人地关系的阐述、教材内容、体系结构、表述手段