K-近邻分类的改进算法研究

来源 :西安科技大学 | 被引量 : 0次 | 上传用户：dingdang19822003

【摘要】

：

K-近邻算法作为一种理论上比较成熟且简单有效的分类算法,已经得到了广泛的研究和应用。但是K-近邻算法易受噪声影响且不能处理多模态分布的问题;另外传统K-近邻算法认为每个

【作者】

：

石鑫鑫

【机构】

：

合肥工业大学

【出处】

：

西安科技大学

【发表日期】

：

2013年期

【关键词】

：

K-近邻分类可信度邻域互信息改进算法属性加权

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

K-近邻算法作为一种理论上比较成熟且简单有效的分类算法,已经得到了广泛的研究和应用。但是K-近邻算法易受噪声影响且不能处理多模态分布的问题;另外传统K-近邻算法认为每个属性对分类的重要程度是一样的,所以并未对属性进行约简,且在距离函数中对每个属性赋予了相同的权重,这样得到的近邻样本是不准确的,会干扰待分类样本的类别判断。　　针对上述问题,本文首先提出了融合互近邻和可信度的K-近邻改进算法(MKNNCF)。第一步,根据互近邻的概念删除噪声数据,提高数据的质量;然后,利用由近邻诱导待分类样本标签的可信度,避免待分类样本近邻中大类吃小类的概率。实验结果表明,本算法在分类精度上优于或相当于传统的KNN及其他经典的分类算法。　　MKNNCF算法虽然一定程度上提高了K-近邻分类算法的分类精度,但是并未考虑不同属性对分类贡献度的差异性。为了进一步提高分类速度和分类的准确率,提出了先对属性约简,之后再对属性加权的改进算法(MIMKNN)。首先,引入邻域互信息用以度量条件属性对分类的重要程度,通过剔除邻域互信息较小的属性完成属性的约简;然后在距离函数中将计算出的邻域互信息作为保留属性的权重。实验表明该算法可以有效提高分类的效率和分类的精度。

其他文献

文本OLAP维度获取与度量计算技术研究

信息数据在现代生产和生活中越来越重要。数据仓库被大型企业及政府广泛用于存储和处理大规模数据。OLAP联机分析处理成为数据仓库处理数据的一种有力工具。OLAP技术能够对数

学位

文本OLAP维度获取度量计算

公共邻接距离基因组片段填充问题研究

近年来,随着基因测序技术的发展,人们能够获得越来越多生物体的基因组,然而这些基因组并不完整。不完整的基因组被称为基因组框架。在很多计算生物学研究领域,无法直接使用基

学位

片段填充公共邻接近似算法局部搜索

虚拟计算系统的性能和能耗管理方法研究

虚拟计算系统是基于虚拟化技术构建起来的新一代计算系统，是对传统计算理论和模式的一次重要创新。它通过引入虚拟机管理器层，消除了底层硬件体系结构和上层系统软件之间的紧密

学位

虚拟计算系统云计算数据中心性能调优能耗管理方法

事件类型识别问题研究

随着信息技术的飞快发展,网络逐步成为一个巨大的数据源,其中包含了众多有价值的信息。这些信息很多是关于已经或正在发生的各类事件的,例如普遍存在于各大网站上的国家政府

学位

事件抽取机器学习事件类型识别文本块候选事件实例

基于多个加速度传感器的跌倒检测系统

学位

遥感图像处理中的变分PDE方法研究

学位

求解最优化问题的类电磁机制算法研究与应用

全局优化技术的应用领域非常广泛，许多实际工程优化问题都能归结为全局优化问题进行求解，这就极大地促进了全局优化技术的兴起和发展。而非线性优化是优化领域内比较难以求解的

学位

类电磁机制算法混沌优化最速下降法预选择机制流水车间调度

基于改进粒子群优化算法的灰度图像分割研究

现在图像处理被应用到了很多行业中,如军事武器系统和医疗影像系统,因此图像处理变得越来越重要。图像分割技术是图像处理众多关键技术中的一种,起步于上个世纪七十年代,到目

学位

灰度图像分割粒子群优化算法协作学习综合学习

基于LDA模型的专利文本分类及演化研究

专利文献是技术情报的载体,它的文本中隐藏了大量的技术情报信息,是技术情报消息的最佳情报来源。随着新中国的快速发展,我国专利的申请数量已在逐年升高,至2016年已经连续第

学位

概率主题模型LDA专利文献文本分类主题演化

和声搜索算法在数字图像分割中的应用研究

随着科技的快速发展,各个行业领域对数字图像的运用也日益增多,图像分割是图像处理的一种基本技术,因此逐渐受到人们的重视。图像分割方法可以解释为把图像分成特征有差异的

学位

图像分割和声搜索算法局部搜索最优和声

K-近邻分类的改进算法研究

与本文相关的学术论文