超长方体覆盖与KNN结合的分类算法

来源 :青岛大学 | 被引量 : 0次 | 上传用户:JIAOAODENVWANG
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据分类是数据挖掘的研究热点。其目的是根据训练数据集的特点构造一个能够把测试数据集中的待测样本映射到某一类别的分类器。利用该分类器,能够提取描述数据类别的模型或预测未来的发展趋势。KNN分类算法是一种简单、易行的分类算法,然而直接应用于训练样本集,其计算量大。本文把区域分离的思想应用于KNN分类算法中,提出了基于超长方体区域覆盖与KNN结合的分类算法。基于超长方体区域覆盖与KNN结合的分类算法有效解决了KNN分类算法在分类时计算量大的问题。其基本思想是:在构造分类器时,为训练集中的每一类数据构造一组超长方体包围这些数据,不同类别的超长方体不会重叠。测试时,判断测试样本是否被某一个超长方体包围。如果被某一个超长方体包围,则该测试样本的类别与超长方体类别相同。否则采用KNN分类算法判断其类别。本文算法中KNN相似度是指一个样本同某个超长方体的相似度。度量方法有两种:待测样本到超长方体中心的距离;待测样本到超长方体表面的距离。具体实验时,KNN的相似度则由这两种距离的加权距离和构成。实验在四个数据集上完成,并与已有的分类算法进行比较,取得了较为理想的分类结果。实验证明超长方体覆盖与KNN结合分类算法是一种有效的分类算法。
其他文献
随着网络社交平台的崛起,海量主观性信息迅速涌现。鉴于这些主观数据往往具有巨大的潜在价值,情感分类、观点挖掘等领域逐渐引起了广泛的关注。然而传统的情感分类具有领域特
微博用户网络是一个涉及普通用户、名人等多类用户要素以及其间关注、推文、转发、评论等多种行为关系的复杂网络,以往对微博用户网络的研究通常仅对一种关系进行讨论,忽略了
随着人们对高速高质量数据传输,以及高容量、大带宽需求的日益增加,每个超级通道以每秒太比特的速率传输成为发展趋势,因此,基于波分复用(WDM)的光网络成为研究热点。在基于波分
光通信网中的传送网和接入网这两个领域目前正朝着高速大容量方向发展,在有限带宽的情况下如何提高通信容量越来越受到关注。偏振复用可以用来提高单根光纤的通信容量,而单载波
为了充分利用彩色成像丰富的纹理细节,及热红外成像在夜视和不良天气条件下的稳定性,应用数据融合的理论和方法,综合热红外与可见光传感器的互补信息,进行图像目标检测。该方法能
生物医学文本中隐含着不断更新的生物医学知识,从这些知识中可以发现基因同疾病之间的关系、基因同蛋白质之间的关系。因此,准确的进行基因名识别是抽取出这些关系的重要前提
随着数据挖掘技术的快速发展,聚类分析技术的应用越来越受到人们的广泛关注。聚类分析是无监督学习的过程,根据数据对象的相似性聚集成簇,从而发现数据集中数据的分布规律和发展
随着科学技术及信息技术的不断进步,电子商务的应用程度越来越高,Web2.0技术的进步在很大程度上对人们的物质生活和价值观念等都产生了非常大的影响,特别是在电子商务和大数
混沌学是从非线性科学引申出来的一门新科学。针对混沌现象研究出的混沌理论,国内外广大学者在流体的湍流、化学及电力系统、保密通讯等方面取得了非常广泛的应用成果。特别是
图像分割是计算机视觉研究的基础问题。变分水平集方法由于其复杂拓扑结构自适应表达、二维/三维图像分割表达的一致性、多模型集成能力等特点,已被广泛用于图像分割中。本文