【摘 要】
:
数据缺失是众多影响数据质量的因素中最常见的一种。如果处理不好缺失数据,就会直接影响分析结果的可靠性,进而达不到分析的目的。文章以医疗领域的缺失值问题为例,通过灵敏
【基金项目】
:
浙江自然科学基金资助项目(LQ15G030001),浙江工商大学一流学科项目(统计学)
论文部分内容阅读
数据缺失是众多影响数据质量的因素中最常见的一种。如果处理不好缺失数据,就会直接影响分析结果的可靠性,进而达不到分析的目的。文章以医疗领域的缺失值问题为例,通过灵敏度、准确率和Kappa值三个指标来比较分析机器填补法和统计填补法在不同缺失率下的填补效果。研究结果表明,在注重小比例人群的医疗领域,机器学习方法表现突出,该方法在三个方面皆优于统计填补法。另外,随着缺失率的增长,两种填补方法的效果都有所下降,但值得注意的是,即使缺失率很高时,机器学习方法的填补效果仍然优于统计方法,且具有很高的稳定性。
其他文献
由于全球性的环境恶化与经济危机使得建筑学人开始反思现代建筑活动中不当的行为方式,从而引发了对低碳经济下绿色建筑的深入研究。生土建筑是人类最早并依然沿用至今的建筑类
为了验证第三代海浪模式WAVEWATCHⅢV5.16中不同海冰损耗源项在秋季波弗特海对海冰存在下海浪的模拟能力,建立自波弗特海至马更些河河口的两级嵌套海浪模型,对2014年8月1日至
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食
Back to yield
波浪波动时间过程及波列的模拟,对于开展实际波浪对于工程建筑物的作用具有重要的意义。本文采用线性叠加的单叠加模型,建立了多向不规则波浪的确定性模拟方法。基于理论模拟
提高政府支持成本估算的准确率,可为各国对未来新能源需求、供应、贸易以及投资决策提供更加准确的数据支持。《世界能源展望2010》对2007—2009年的可再生能源发电和生物燃料