针对机器学习中残缺数据的近似补全方法

来源 :西安交通大学学报 | 被引量 : 0次 | 上传用户:woshishagua6
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对机器学习中含残缺项的数据不能被有效利用,导致分类和回归准确率不高的问题,提出了一种近似补全方法——k-ANNO方法。给定残缺的数据样本,该方法首先通过离线构建的图结构来近似搜索与该样本最接近的k个近邻顶点,然后采用快速二次规划估计各近邻的最优权重,最后基于权重值来补全样本中的残缺项,用户可以根据实际需求在补全效率与准确性之间折中。k-ANNO方法较好地解决了机器学习中普遍存在的数据残缺问题,有效抑制了数据残缺对分类和回归精度的干扰。利用多份公开数据集评估了k-ANNO方法的补全效果,结果表明:当加速比在2~10之间时,k-ANNO方法的分类错误率比已有的均值补全、C均值补全、自组织映射补全方法低1%~4%,回归均方根误差比已有方法低约0.5~2.0;当样本规模为4 000时,在不同加速比参数下,k-ANNO方法的计算效率比朴素k近邻方法高约35%~320%。
其他文献
坦桑尼亚是东部非洲城市化发展最快的国家之一,长期与中国保持密切合作关系。坦桑尼亚城市体系及空间分布研究可为当地城市发展决策及中-坦在城市建设方面的合作提供科学依据
【正】 Win98 9月1日的午夜大售卖使得我和许多喜爱计算机的朋友一样,有机会领略到Microsoft 公司强劲推出的新一代操作系统,感觉确实不一样。想随我一同感受一下 Win98吗?来
通过优化工厂的选煤技术流程进行展开,与具体的工艺实际相结合,基于对洗选工艺中产生的问题以及原因的分析,对选煤的优化和改进设计进行针对性的展开,并分析总结改进技术的实
1936年10月25日,中国工农红军第四方面军红三十军、红九军、红五军和四方面军总指挥部奉军委命令组成西路军,进军河西走廊,执行打通“国际通道”的重大军事任务。本文主要通
<正>在江西九江,有一所享有"干载学府、百年名校"之美誉的学校,它就是九江第一中学,学校正式立校于1902年,直接历史113年;前身为宋明理学奠基人周敦颐所创办的濂溪书院,间接
期刊
在人类政治文明演进的历史长河中,社会主义国家政党政治作为一种新型政治形态,经历了100年的发展历程。社会主义国家政党政治百年探索,涉及马克思主义执政党治党管党和治国理
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技