缺失数据处理方法的比较研究

来源 :计算机科学 | 被引量 : 0次 | 上传用户:liuyu80237029
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘已被广泛用于医疗领域,而大多数医疗数据集都存在缺失值。本文介绍了一些缺失值估计算法。建立了5种模型来提高预测的有效性,它们是保留缺失模型、直接丢弃模型、贝叶斯朴缺模型、贝叶斯重叠补缺模型和基于信息增益的贝叶斯重叠补缺模型。这些模型在Clinics数据集上进行了处理和分析。用C4.5决策树和10叠交叉确认法来检验这些模型的性能,结果表明根据信息增益递减顺序排序,用朴素贝叶斯分类器来预测缺失值是有效的。
其他文献
文章对动产抵押和动产质押两种担保方式进行了比较,阐明了两种担保方式的主要区别.
目的探究耳内窥镜下鼓膜穿刺术联合药物注射治疗分泌性中耳炎的临床效果。方法100例分泌性中耳炎患者,随机分为对照组与观察组,各50例。对照组采用耳内窥镜下鼓膜穿刺术治疗,
本文参照“历史文化名域”提出了“民族历史文化名村”的概念,并就创建和保护“民族历史文化名村”以及在发展旅游经济、弘扬民族文化、建立民族文化大省中能起的重要作用进行
决策者的注意力分配是公共管理中的核心问题。论文提出领导人注意力变动的类乐透球模型,在正式职务稳定的情况下,议题重要性、问题严重性和领导偏好影响着领导人注意力分配。
<正> 为什么需要在冬季贮备大量的蜂王?这是由于在加拿大和美国北部每年5月之前,养蜂者就亟需大量的蜂王,但因气候的限制养王场在此时无法生产出蜂王的缘故。所以养蜂生产上
高中学习过程中,学生对于球体及其组合体问题的处理很难实现全面而系统的掌握,所以教师应注意给学生呈现浅入深出的通性通法,使他们一通百通,以不变应万变。本文本着这一原则
金庸武侠小说汉译英理论和实践都存在问题:英译本偏少,相关研究的论文数量不多。金庸武侠小说英译不足是中国文学译入译出失衡的一个缩影。从文化特色词来看,侠、江湖、武功
最近中共中央国务院召开的中央经济工作会议指出:“要积极推进西部大开发,有效发挥中部地区的综合优势,支持中西部地区加快改革发展,振兴东北地区等老工业基地,鼓励有条件的
研究生扩招是我国大力发展高等教育的一个重要举措,其中在校硕士研究生的数量增长远远超过了在校博士研究生的数量增长.在短期内达到相当的规模,硕士研究生的培养质量受到社会
研究了热老化和湿气老化对橡胶钢丝帘线粘合性能的影响,分析了不同老化条件下的粘合失效机理。通过实验测试了抽出力大小及钢丝表面附胶量多少,分析得出了老化因素对橡胶钢丝