【摘 要】
:
目的:利用数据模拟技术模拟不同缺失模式和不同缺失率的数据集,比较几种填补方法的优劣,并探讨其适用性。根据其适用性找出适合课题数据的填补方法,为进一步的课题数据分析做准
论文部分内容阅读
目的:利用数据模拟技术模拟不同缺失模式和不同缺失率的数据集,比较几种填补方法的优劣,并探讨其适用性。根据其适用性找出适合课题数据的填补方法,为进一步的课题数据分析做准备。方法:单调缺失模式中横断面连续性变量缺失:采用Ad hoc法、回归法(regression method)和趋势得分法(propensity score method)三种方法进行比较。单调缺失模式横断面分类变量缺失:采用Ad hoc法和Logistic回归方法进行比较。任意缺失模式横断面连续性变量缺失:采用期望最大化法(expectation-maximization,EM)、基于链式方程的填补(multiple imputation bychained equations,MICE)和马尔可夫链蒙特卡罗(Markov Chain Monte Carlo,MCMC)三种方法进行比较。纵向数据缺失:采用LOCF(1ast observation carriedforward)法、基于链式方程的填补(MICE)和马尔可夫链蒙特卡罗(MCMC)三种方法进行比较。结果:单调缺失模式中横断面连续性变量缺失:当缺失率较低(<10%)时,Ad hoc法无偏性和有效性较好;当缺失率较大时,回归法具有优势。单调缺失模式分类变量缺失:当缺失率为10%~30%时,logistic回归法填补无偏性和有效性较好;当缺失率>30%时,填补结果不理想。任意缺失模式连续性变量缺失:EM法在不同缺失率时均有较好的填补结果。纵向数据缺失:当数据缺失率较低时采用多重填补中的MCMC模型填补方法,缺失率>50%时,三种方法填补结果均不理想。结论:数据填补时需要根据不同的数据缺失率、不同的数据缺失模式和不同的数据变量缺失类型,选择不同的填补方法。
其他文献
对冻融前后的花岗斑岩进行相关静态、动态力学试验,获得试样不同冻融次数下的弹性模量、泊松比、单轴抗压强度、抗拉强度及冲击动载应力–应变曲线。在Holmquist-Johnson-Coo
汽车的NVH性能决定了汽车的内在品质,汽车的动力总成悬置系统设计的优劣对汽车的NVH性能有重要的影响。针对某混合动力客车行驶时出现的NVH状况,通过建立客车动力总成悬置系
目的:探讨脑电双频指数(Bispectral index,BIS)在甲状腺腺瘤切除术全身麻醉深度监测中的应用效果。方法:选择择期行甲状腺腺瘤切除术患者40例,随机分为研究组和对照组,每组20例。
银行是经营风险的企业,风险管理是银行业一个永恒的话题。美国金融危机给我们的一个教训就是要用系统的观点来审视整个金融体系的稳定性,要建立更加宏观审慎的监管体系。而宏观
针对寒区节理岩体,提出冻融细观损伤,受荷细观损伤与节理宏观损伤的概念。基于Lemaitre应变等效假设,推导冻融受荷条件下考虑节理岩体宏细观缺陷耦合的复合损伤变量。以完整
英语专业四级考试(TEM-4)是国内唯一专为英语语言文学专业学生基础阶段设计的大规模标准化的语言测试。作为一项较为权威的正规标准化的全国性考试,TEM-4正在逐渐为社会所认
国内对颜色词的研究已取得十分显著的成果,大多数文章都是从汉语基本颜色词出发,讨论汉语基本颜色词的意义和文化内涵。本文研究的是汉俄颜色词对比,除了对汉俄颜色词的文化
目的观察肌构筑学原理在A型肉毒毒素治疗脑卒中后痉挛中的应用。方法40例脑卒中后偏瘫患者,伴有上肢屈肌、下肢伸肌痉挛,改良Ashworth评分3级以上,分为观察组和对照组各20例,
文章以2003—2014年省政府公共预决算信息和城投债数据为样本,实证考察了政府会计信息对发债规模、发债成本的影响。结果表明:预决算赤字、预算调整赤字正向影响发债规模,良
目的检测血清铁(Serum Iron)、铁蛋白(Ferritin)和可溶性转铁蛋白受体(Soluble transferrin receptor,sTfe)等指标,并分析这些指标在诊断妊娠妇女缺铁性贫血中的临床意义。方