【摘 要】
:
目的探讨完全随机缺失机制下,成组删除法、均值填补法、回归填补法和多重填补法处理缺失数据的效果及趋势。方法运用R语言,采用Monte Carlo技术模拟完整数据集、不同缺失比例
【基金项目】
:
国家自然科学基金(81373100),蚌埠医学院研究生创新计划项目(Byycx1658)
论文部分内容阅读
目的探讨完全随机缺失机制下,成组删除法、均值填补法、回归填补法和多重填补法处理缺失数据的效果及趋势。方法运用R语言,采用Monte Carlo技术模拟完整数据集、不同缺失比例和相关系数条件下的数据集,比较各种方法处理缺失值的效果。结果当缺失比例为10%时,4种方法处理效果一致。随着缺失比例增加,4种方法处理后均值变化不大;均值填补法处理后相关系数小于其他方法,多重填补法和标准一致,回归填补法填补后相关系数比其他方法偏高而且呈增加趋势。随着回归系数的增加,回归填补法的相关系数准确性增加。结论 4种方法处理完全随机缺失机制下两个相关变量的效果不同,当缺失比例较低时,建议采用成组删除法或回归填补法。当缺失比例较大时,建议使用多重填补法。
其他文献
当科技成为全球竞争的制高点以后,科学技术创新型企业的发展成为一国国力和经济发展的澎湃动力,为了扶持科创企业更快的发展,2019年我国在上海证券交易所成立了科创板,目的是
目的 logistic回归是生物医学研究中常用的方法,可以进行影响因素筛选、概率预测、分类等。高通量测序技术得到的数据给高维变量选择问题带来挑战。惩罚logistic回归可以对高
化学电容器,又称超级电容器,是可以快速充放电的储能设备,具有比功率高、循环寿命长、安全以及环境友好等优点,它的出现填补了电池和传统电容器之间的空白,在启动电源、脉冲
<正> 笔者自93年以来采用电针结合中医辩证施治的方法治疗中风偏瘫26例,取得了较好的效果,现报告如下: 1 临床资料本组26例均是门诊病人,其中男性8例,女性18例;年龄最大62岁,
城市流浪乞讨现象是社会长期聚焦的热点,其中儿童的流浪乞讨更值得被关注。流浪乞讨儿童普遍处于社会边缘化的处境,极有可能成为具有反社会倾向的团体,更为重要的是,颠沛流离的流浪生活直接妨碍了他们身心的健康成长。本文基于网络爬虫技术获得的大量流浪乞讨儿童基础数据,借助空间分析工具对流浪乞讨儿童的区域特征进行探究,并通过多种计量方法评价各区域救助管理水平及协调度,对进一步优化流浪乞讨儿童的救助管理提出建议。
通过对木薯清洗机滚筒内运动轨迹的分析,建立了圆弧—抛物线运动轨迹方程;研究了木薯在清洗机滚筒内运动的最内层最小半径、最佳脱离角、最大降落高度、清洗系数及滚筒最佳速度
目的探究应用Autar量表评估肺癌患者经外周静脉置入中心静脉导管(PICC)相关性血栓风险的效果。方法选取我院2016年10月-2018年10月收治的86例采用PICC行化疗的肺癌患者为研究
<正>临床资料:本组16例,其中男15例,女1例:年龄23~68岁。煤矿爆炸伤14例,浴池锅炉爆炸2例。在抗休克治疗的同时一侧或双侧行胸腔闭式引流术13例。然后气管切开,机械通气,处理