【摘 要】
:
机器学习和数据挖掘已经应用于诸多领域.然而由于各种原因,真实数据集通常包含缺失值.为了提高填补缺失值的准确率,文章基于不完整数据的不同缺失率,在R平台上对7种插补方法
【机 构】
:
齐齐哈尔大学,计算机与控制工程学院,黑龙江齐齐哈尔161006
论文部分内容阅读
机器学习和数据挖掘已经应用于诸多领域.然而由于各种原因,真实数据集通常包含缺失值.为了提高填补缺失值的准确率,文章基于不完整数据的不同缺失率,在R平台上对7种插补方法进行评估.实验结果表明,缺失森林和马尔科夫链蒙特卡洛方法的平均绝对百分误和误分类比率优于其他填补方法.基于验证结果,提出了一种混合插补方法,即在计算数据集的缺失率之后,使用缺失森林估算缺失率小于等于5%的缺失值,然后使用马尔科夫链蒙特卡洛填补缺失率为5%到10%的缺失值.
其他文献
本研究通过现代文献、教材及专家咨询调研,建立捏脊疗法的操作技术标准有助于教与学.为按摩推拿学手法规范化工作做基础和铺垫性的工作.现有的资料对于按摩推拿学手法规范化
高速公路是交通发展的重要途径。但高速公路上的车祸仍在威胁着驾车人士的生命安全。有没有一种既高速又安全、彻底杜绝车祸的公路呢?美国传媒最近披露,由美联邦政府运输部
Level3通信公司与FLAG电信公司已经签了一个新的数兆兆比特级的泛亚海底光缆系统。这种六光纤对的系统设计成在香港、汉城、东京和台北的高业务量中心之间提供整个地区的城市到城市连接
在高密栽植中,4种栽植方式条件下(单行式、3行畦植式、6行畦植式和全域式),细长纺锤形和北荷兰纺锤形两种树形的效率。每种方式中有一半树进行了夏剪。以Red Boskoop苹果树为
文章基于我国1999-2019年的省级面板数据,对当前文献中用于衡量产业结构变迁的三种指数进行了相关性检验,发现基于比重加权相加法测算的产业结构升级指数和基于向量夹角法测
基于面板数据的向量自回归模型(PVAR),是向量自回归(VAR)模型向空间维度的拓展,也是面板数据模型与向量自回归模型的融合.文章从PVAR模型的发展脉络、面板数据向量自回归模型
软枣猕猴桃Actinidia argu ta(Sieb·ot Zucc·)Planch和野山楂、山葡萄等东北山区的土特产植物,不单是营养丰富的果树资源,而且具有良好的中药价值(1);同时还可加工高级营
受试者30例按照帕金森病诊断标准,纳入标准及排除标准纳入受试者.入组患者应用三焦针法治疗三个月.观察治疗前后日常生活质量量表(ADL)、简易智能量表(MMSE)、改良Webster量
色彩缤纷的彩椒与普通大辣椒相比,彩椒肉厚、味甜,具有较高的含糖量和维生素C。主要用于生食或切丝拌沙拉酱。颜色鲜艳的菊苣其以脆嫩的口感、微苦带甜的味道、适宜鲜食的特
文章运用DEA-Malmquist模型考察长江经济带沿线11省份文化产业发展质量,采用加法分解并分析技术进步助推文化产业高质量发展的贡献率,通过Tobit面板计量模型考察不同技术进步