缺失数据插补方法及其在医学领域的应用研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:playlogic
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在当前的大数据时代,随着计算机技术的快速发展,数据采集和数据传输将更加便捷和快速,这也使得数据日趋复杂,数据规模不断增长,从而形成了大量有缺失、失衡、高维等复杂数据。在众多复杂数据的类型中,缺失数据是最常见的一种,并普遍存在于各个领域,尤其在医学领域,数据信息不完整会降低医学数据质量,导致有用信息的流失,可能会对机器学习的结果造成一定的误差干扰,因此缺失数据处理成为医疗数据处理研究的一个重要的课题。本文主要是针对缺失数据插补方法在医学领域上的研究与应用,主要工作可归纳如下:1)本文介绍了三种缺失数据插补方法,包括K最近邻插补法、多重插补法、缺失森林插补法,并在医学数据集Statlog(Heart)上利用这三种缺失数据插补方法进行了实验。实验结果表明了在缺失率相同的情况下,缺失森林插补法在该医学数据集上插补效果是最好的,能有效降低机器学习的判别干扰,但从插补时间来看,缺失森林插补法的插补时间效率较低,这是缺失森林插补法的不足之处。2)针对缺失森林插补法存在的不足之处,根据它的算法特点进行改进,提出了基于缺失森林的KNN-MF插补法,并使用三个医学数据集对提出的插补方法进行实验。实验结果表明了改进的KNN-MF插补法,能在一定程度上提高插补的时间效率,同时能够有效提升插补效果。
其他文献
采用单因子试验法,初步研究了利用乙烯利催熟软化胡椒鲜果的方法。结果表明,药剂浓度和药剂浸泡处理后鲜果存放的方法对催熟软化效果的影响比较大,鲜果在溶液中浸泡的时间对催熟
《普通高中英语课程标准》(2017)指出:学习能力的培养有助于学生做好英语学习的自我管理,养成良好的学习习惯,多渠道获取学习资源,自主、高效地开展学习。本研究以都匀三所普通高中的556名学生作为研究对象,对学生英语自主学习能力开展调查研究,主要回答四个问题:1)高中生英语自主学习能力的总体概况如何;2)高中生英语自主学习能力在学习领域上(文科和理科)是否存在显著性差异;3)高中生英语自主学习能力是
针对于并购市场,国家相关的优惠政策越来越多,并购活动交易不断攀升。近些年,企业的并购价格远远超过账面可辨认净资产公允价值,从而产生了大量的商誉。商誉额逐年递增侧面表现了并购热潮和高溢价的市场现象。合并后,很多上市公司披露显示业绩受到商誉减值准备影响。这似乎预示并购市场的商誉减值带来的问题将会频繁出现。对于并购重组产生的巨额商誉更加导致了上市公司未来业绩的不可测,因此制定防范计提巨额商誉减值准备风险
结合国内外已有研究,分别项目建设期间和道路营运期间,对道路交通建设的生态环境影响及形成机理进行了归纳和分析。
“影”隐喻文学,“形”隐喻鲁迅自己,“影”和“形”的复杂关系,暗示鲁迅对文学功用性的暂时怀疑心理及在痛苦绝望中也要存留希望、奋起反抗的精神。 The complex relations
耐热真菌(thermotolerant fungi)是一类最高生长温度在50℃左右(通常为40℃或40℃以上),最低生长温度在20℃以下的特殊真菌类群。耐热真菌在高温条件下表现出独特的生存适应
在中国当下的社会,习惯权利作为一种事实上的权利,在生活中被真实而有力地表达出来的案例比比皆是。只要我们留意关注各地法院的诉讼案件便可知道,民众直接或间接以习惯权利
目的探讨综合护理在降低心胸外科术后患者肺部感染的作用。方法选取我院收治的心胸外科术后患者290例进行研究,分组方式以抛硬币法为依据进行,对照组145例,采用常规护理方式
本书为“外国网络法选”丛书中的一本,内容涵盖了美国建国后的《电信法》《互联网免税法》《数字千年版权法》《统一电子交易法》《电子隐私权法》《反网络域名抢注消费者保