改进的LMS-KNN近邻分类方法研究

来源 :电子科技大学 | 被引量 : 2次 | 上传用户:wangpeng532
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近邻分类算法作为经典的机器学习算法之一,因其无需估计参数、易于实现、适合多分类问题的特点,近年来在广告、聊天机器人、网络安全、医疗保健、营销策划等领域得到了广泛应用。其中,基于局部均值与类均值的近邻分类算法(Nearest neighbor classification based on local mean and class mean,LMS-KNN)是针对K近邻分类(K-nearest neighbor classification)对离群点不敏感,没有利用样本全局信息等问题的一种改进算法,改进后的算法虽然在分类精度和分类效率得到一定的提高,但是该算法还存在一些弊端。数据的不平衡性会影响LMS-KNN的分类精度,同时该算法涉及到很多参数的设置,如近邻值K的选取、权值的确定、距离度量方式的选取等等。因此,为了进一步改进LMS-KNN算法的分类精度,本文进行了以下的研究工作:1)总结分析了几种常用的近邻分类方法和局部均值与类均值的近邻分类算法,对比了它们各自的算法原理和优缺点,并简单介绍了文中所用到的几种优化算法。2)针对不平衡数据对LMS-KNN分类精度的影响,运用迭代近邻过采样的算法对数据进行预处理,并把处理后的近似平衡数据集,用半监督的局部均值与类均值进行分类。3)采用交叉验证与传统迭代算法确定LMS-KNN分类算法参数,本文先将该分类算法交叉验证误差模型化,再把类均值向量的权重基于客观决策信息确定为数学公式,最终运用步长优化的统一迭代法来对加权权重进行选取,在平衡主客观决策规则的情况下改进传统算法的分类精度和分类效率。4)为了优化LMS-KNN分类算法参数的确定,利用遗传算法(Genetic Algorithm)可以在不依赖问题具体领域的情况下求解非线性、多目标等复杂优化问题,提出了一种基于遗传算法的局部均值和类均值最近邻分类算法,该方法选取类均值的权重为初始种群,以分类误差为评价函数,通过遗传迭代选取最佳的类均值特征权重,与传统的KNN、LM-KNN(A local mean based nonparametric classifier)及LMS-KNN算法的实验比较分析表明,该方法在UCI数据集上可有效地搜索出合适的特征权重,获得更好的分类精度。
其他文献
近邻分类算法因其简单有效等特性已被广泛应用于各大领域,但它的诸多弊端也日益显现。其中,复杂数据的出现导致分类器的时间空间消耗巨大,这就需要通过适当的数据预处理操作
现代纸张生产过程越来越高速化、自动化,纸病的人工检测已无法满足精确高效的要求。本课题主要利用高速相机实现纸病信息的在线检测,实现了对褶皱、裂口、孔洞、污点等纸病所在
风力发电机组从设计、制造到安装、运行、维护、检修有许多环节,任何环节的偏差都会造成设备性能劣化或故障,为了保证风力发电机组运行的可靠性,就需要有功能完善的在线监控
随着国民经济的快速发展和城乡一体化建设的大力推进,我国中小城市交通建设正处在跨越式发展的阶段,尤其是伴随着机动车保有量的急剧增长和城市空间的不断拓展,中小城市也日益显
本文研究了飞机故障诊断的技术背景,针对现如今飞机故障的特点提出了基于案例推理与故障树分析的飞机故障诊断专家系统,针对飞机故障进行基于案例推理与故障树的混合推理,提高了
锂离子电池由于具有体积小、质量轻、能量密度大、工作电压高、使用寿命长和无环境污染等优点,使其成为了应用范围最为广泛的二次电池,同时作为最主要的移动电器能源起着越来越重要的位置。锂离子电池卷绕机一一作为锂离子电池生产中的一个关键设备,决定着锂离子电池的高质、高效生产。目前国内高质量的卷绕机主要还是从国外引入,其成本昂贵且技术支持等方面也得不到保障,很难满足市场的需求。而国内电池设备供应商提供的电池卷
在现代物流发展的过程中,伴随着城市交通状况、生态环境情况的不容乐观,城市物流的“外部不经济”逐渐引起了人们的重视,在当前经济快速发展的环境下,如何优化城市物流配送方
铜闪速熔炼是现代火法炼铜的主要方法。由于熔炼过程机理复杂、关键工艺参数无法实时测量及参数之间关联耦合严重,导致熔炼过程建模及优化控制困难。熔炼过程中积累了大量生
RoboCup救援仿真系统是一个通过模拟现实生活中的城市地震发生后,用机器人智能体搜索整个城市并实施灾难救援工作的多智能体系统。系统具有智能体的异构性、任务关系的复杂性
平顶光束被发现以来,其独有的特性就引起众多研究者的兴趣,并将其应用到诸多领域。平顶分布光束指的是强度分布均匀的光束。光镊即单光束梯度力势阱,是由在高聚焦光束的束腰