基于核最近邻表面的分类方法研究

来源 :华东理工大学 | 被引量 : 0次 | 上传用户:liuhu986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文针对传统分类方法在解决大规模数据集时存在的问题,提出了一种新的分类方法-基于核最近邻表面的分类方法。本文首先分析了该方法的基本原理和主要思想:该方法将训练集按照最近距离原则分成若干核,并使这些核包含全部的训练样本;测试集样本按照最近邻表面的原则进行标记。其基本思想是用少量的核来代替大量的训练样本,以降低大规模数据集在学习过程中对存储空间的需求。为了提高分类正确率,本文对样本与核表面之间距离的衡量标准进行选择,最终决定采用Euclid距离的四次方差作为距离的衡量标准,并对距离决策规则进行适当的调整和修正。 最后将该方法用于UCI Machine Learning Repository的部分数据集上(Iris,Sonar,Liver Disorders,Australian Card等)。实验结果表明,与现有的分类方法,如Fisher、SVM、K-近邻、BP神经网络等相比,该方法具有记忆样本数少,学习时间短,分类速度快等优点。为了进一步验证该方法的有效性,本文该方法用于Letter和USPS大规模数据集。实验结果表明,该方法在大规模数据集上降低了存储空间的需求,缩短了学习时间,优点表现更加明显。
其他文献
随着微电子技术、通信技术以及移动应用的发展,智能移动设备近年来得到前所未有的高速发展,已经成为用户随身携带的必需品而成为日常生活中不可或缺的一部分。为了取得功能和新
传统的分子生物学着重于研究单个基因的功能。但是,生物体是一个复杂的系统,基因彼此相互作用形成网络。基因网络的功能并不简单的是单个基因功能之和。因此,在后基因时代,功能基
目前,行业信息化发展迅猛,但以往众多信息系统的开发缺乏整体规划和系统性,随着异构环境不断增加,数据交换困难,“信息孤岛”问题愈发突出。为了适应企业需要,有越来越多的应
需求工程是软件工程第一阶段的一个重要活动,其目的是得到对需求的准确清晰一致的描述以及相应的求解限制。需求工程在方法、技术、工具等各个方面正在逐渐成熟,但是关于需求获
IGRS标准是我国有完全自主知识产权的数字家庭标准。我国为加大本国技术在国际技术领域的影响,十分重视IGRS标准的制定和推广。国际标准化组织国际电工委员会正式接纳中国“闪
人脸是人类最重要的生物特征之一,传递着性别、表情、年龄、种族等丰富的信息。利用计算机进行人脸图像分析是计算机视觉和模式识别领域里的一个重要课题,作为人脸识别技术的重
随着计算机技术和网络技术的迅猛发展,计算机系统已经从独立的主机发展到复杂的、互联的开放式系统,这种情况导致计算机及网络的入侵问题越来越突出,为保护系统资源,需要建立不同
风云四号(FY-4)静止气象卫星是我国第二代地球同步轨道卫星,主要负责观测大气环境。不同于美国、欧洲将成像仪和探测仪分别安装在不同的卫星上,FY-4将两个载荷安装在同一颗卫星
语义异构是虚拟组织成员间实现信息共享所面临的一个核心挑战。解决此问题的一种有效方法是集成成员本体,形成领域知识的公共全局视图(虚拟组织本体),从而为异构资源提供统一的
中医是中华民族的瑰宝,辨证论治是其之精髓。方剂是中医辨证论治的完整体现,它集中医之理、法、方、药于一体,是一个经历了几千年积累的庞大数据集合。数据挖掘是一种新兴的信息