SAS中处理数据集缺失值方法的对比研究

来源 :计算机应用 | 被引量 : 0次 | 上传用户:aliuyangba
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
采用SAS软件中的多重填补法(MI),期望最大化算法(EM)和Ad Hoc法分别对医疗费用集的缺失值进行处理,比较三种方法的优劣并探讨其在医疗费用缺失值处理中的适用性。运用SAS9.10,采用数据模拟技术,分别模拟真实医疗数据集的各种缺失率的随机缺失数据集,分别用MI、EM和Ad Hoc对各缺失数据集进行处理,对结果进行比较和分析。结果:数据缺失率≤10%时,Ad Hoc更优;数据缺失率在15%~30%时,经MI处理后的分析结果更接近“真实”;数据缺失率≥35%时,三种方法均无效。结论:对不同缺失率的费用科目缺失数据集,MI和Ad Hoc对缺失值的处理各有优劣,EM效果略差于MI,没有明显优势。
其他文献
最近20年是《水浒传》批评成果很多、成绩很大的时期。其主要原因,一是思想解放的潮流溶解了冰封的学术大地,“双百”方针得到了贯彻;二是理论与方法的多样性。本文从“拨乱
20世纪90年代,随着科学技术和社会经济形态的发展,人类迈入了“体验经济时代”。美国经济学家派恩和吉尔摩在《体验经济》一文中说到,体验本身代表一种已经存在的,先前并没有
[研究目的]罕见变异在冠心病这样的复杂疾病模型中的作用越来越受到重视。有研究证明低密度脂蛋白相关受体蛋白6(LRP6)的罕见变异可以造成家族遗传性冠心病,并且伴有高血糖、
目的:总结当前中西医结合疗法治疗高龄股骨转子间骨折的经验,分析对比PFNA加中药治疗和单纯PFNA手术治疗的临床疗效。方法:2009年10月至2011年10月,北京中医药大学东直门医院骨
通过提供满足客户需求的各种服务性活动,企业不仅能有效提升自身的竞争能力,而且能实现良好的客户满意、客户忠诚和企业绩效。因此,如何对企业现有的物流客户服务进行分析和
金刚烷及其氨基衍生物普遍具有良好的脂溶性和低毒性,并表现出独特的药理作用,用于抗病毒、抗肿瘤、抗帕金森综合症、抗糖尿病、抗抑郁等特效药物的合成。金刚烷胺盐酸盐是临
上世纪四十年代,无名氏凭借《北极风情画》、《塔里的女人》两部爱情小说登上中国现代文学文坛。随后他在艺术上不断追求创新超越自我,以宏观的文化视野来思考人类生存的困境
俗话说:“一方水土养育一方人”如果说中国的水彩画由传统的较比单一的方式向多元化发展,那么一定是中国各个地方地域文化的体现和汇聚的结果。随着文化意识形态的多元化发展和
改革开放30多年,中国经济以年均约10%的速度高速增长,取得了举世瞩目的成就。期间,要素投入增长方式发挥了重要的作用,但目前该种增长方式面临许多困境,变得不可持续。如依靠
提出一种针对物体空间为序体绘制的空域跳过算法:采用双层次空间跳过,先以规则的数据分块作粗略地跳过,再以八叉树获得更高粒度的优化。该方法进一步解决了超过可用纹理内存