一种有效的不完整数据分类器

来源 :计算机科学 | 被引量 : 0次 | 上传用户:wbgbg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在模式识别、机器学习以及数据挖掘中,分类是一个基本而又重要的问题。虽有大量的分类器应运而生,但由于处理不完整数据的复杂性,它们大都是针对完整数据的。然而,由于各种原因,现实中的数据通常是不完整的。因此,对不完整数据分类器的研究具有重要意义。通过分析以往在分类过程中对不完整数据的处理方法,提出了一种不完整数据分类器:DBCI。在DBCI的训练过程中,将缺失值的频数按比例地分配到其它观测值的频数中。因此,不完整数据集所包含的信息可以得到充分利用。在12个标准的不完整数据集上的实验结果表明,与分类效果显著的不完
其他文献
提出了耦合系数的概念,构造了一个新的耦合元胞自动机模型,并分析了耦合系数对耦合元胞自动机时空演化的影响。针对已有的单耦合元胞自动机加密系统中存在的不足,提出了基于多耦
对国标GB/T 5009.182-2003中样品处理方法做了改进,用干法灰化代替湿法消解,解决了国标方法中由于pH值和高氯酸对显色反应的影响造成检测结果不准确的问题。采用干法灰化-分
大规模地形可视化是大型户外环境模拟不可缺少的组成部分,也是近年来可视化领域的研究热点,在游戏、仿真、虚拟现实、地理信息系统等领域有着广泛的应用。本文重点讨论了国内外学者在该领域的研究方法和最新研究进展以及尚未解决的问题。从数据拟合和模型简化两个方面叙述了自适应地形可视化建模方法,根据对现代图形硬件是否友好,将地形模型简化算法归纳为面向CPU的细粒度LOD算法和面向GPU的粗粒度LOD算法两类,同时
由GCC编译器对C语言源程序进行语法分析产生的抽象语法树文本存在大量的冗余信息,如果直接对其进行解析,则会产生解析效率低、产生的抽象语法树会占用大量的存储空间的问题。
发现并验证了Web访问的局部性原理,在其基础上提出一种全新的集中分类学习但分布协作运行的基于P2P的客户端缓存模型——Smart Cache。SmartCache采取集中方法学习节点访问兴