【摘 要】
:
针对现实数据集的数据缺失问题,提出了一种基于双聚类的缺失数据填补新方法。该算法利用双聚类簇内平均平方残值越小簇内数据相似性越高的这一特性,将缺失数据的填补问题转换
【机 构】
:
中国科学院沈阳自动化研究所,中国科学院大学
【基金项目】
:
国家重大科技专项基金资助项目(2011ZX02507-006)
论文部分内容阅读
针对现实数据集的数据缺失问题,提出了一种基于双聚类的缺失数据填补新方法。该算法利用双聚类簇内平均平方残值越小簇内数据相似性越高的这一特性,将缺失数据的填补问题转换为求解特定双聚类簇最小平均平方残值的问题,进而实现了数据集中缺失元素的预测;再利用二次函数求解极小值的思想对包含有缺失数据的特定双聚类簇最小平均平方残值的问题进行求解,并进行了数学上的分析证明。最后进行仿真验证,通过观察UCI数据集的实验结果可知,提出的算法具有较高的填补准确性。
其他文献
2008年,各地都反映南美白对虾养殖病害发生率普遍较高,一些地方甚至出现养殖南美白对虾全部死光的情况,给养殖户造成了很大的经济损失,也严重挫伤了他们的养殖积极性。为此,
通过对菇类防杂剂粉剂中杀菌剂筛选试验、水剂和粉剂用量优化试验及在香菇中应用效果试验研究。结果表明粉剂中杀菌剂宜选用多菌灵和磷镁等营养剂复配物,每吨干料使用菇类防
乳酸菌是国内外公认安全的食品级微生物,细菌素是其在代谢过程中由核糖体合成产生的一类多肽或者前体多肽,其具有广泛的抑菌谱。随着化学防腐剂造成的食品安全问题日益突出,
在新课改背景下,传统的初中数学教学方式已经不符合时代发展的要求了,教师必须转变教学观念,不断创新教学方式,善于总结重、难点,发现学生的薄弱处,激发学生学习数学的兴趣,
本文介绍了自回归模型与解集模型的基本原理,结合玛纳斯河流域的水文规律,分别应用二种随机模型对流域的水文进行模拟,二种随机模拟的实用性检验结果表明,自回归模型较解集模
分析了校园数字化建设的重要性,介绍了基于教学资源获取智能化的校园数字化建设功能,构建了校园数字化建设智能化获取教学资源的软硬件平台,最后给出了教学资源获取智能化的
我国商业银行的经营绩效,关系到对银行业的竞争力和应对全面开放的挑战能力的评价。传统的银行业绩评价指标体系虽对科学评价银行业绩具有重要作用,但也存在一定程度的局限性
莎士比亚在其四大悲剧之一《麦克白》中描述了多个人物角色的睡眠,同时,他也把死亡比喻为睡眠。因此,《麦克白》中的"睡眠"意象具有双层含义:一般意义的"睡眠"以及"死亡"。实
基于PHP(hypertext preprocessor)的Web应用程序是目前互联网中使用最为广泛的Web应用,一旦PHP Web应用程序出现安全漏洞,系统中存储的数据和用户的安全就受到很大的威胁。因