基于自然进化策略的特征选择算法研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:xuhaoumsl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
特征选择是特征工程领域中子集筛选的一种框架,是一种NP-难问题。在当今大数据时代,很多领域中都包含大量的数据信息,数据成为了一种重要资源。为了高效利用数据,从数据中挖掘有效特征就尤为重要。特征工程首先将客观数据编码为特征,特征选择便服务于特征的筛选,其旨是剔除特征集合中不相关及冗余的特征来减少模型训练的时间,提高模型预测的精确度。因此特征选择在机器学习、数据挖掘和模式识别等领域中是一种重要的数据预处理手段。特征选择表现为在原始特征集合中挑选优质特征子集的过程。一般由于缺少先验知识,无法准确筛选出和描述目标最为相关的特征,面对该问题通常会采用一些评价准则对特征进行评估,这可以选出优质的特征,但是很难挖掘优异的特征子集。一种简单的寻找最优特征子集的方法就是穷举法,穷举法试图枚举出所有的特征集合,这可以找到全局最优的特征子集,但是穷举搜索方式无法满足较高维数据集的性能需求。进一步随机算法作为一种优化方法可以很好地应用到特征选择中,并且由于随机算法出色的全局搜索能力在特征选择中取得了不错的效果。进化策略作为一种随机搜索方法被广泛用于目标优化中。进化策略模拟基因进化过程,采用基因突变、产生种群、筛选个体等进化机制来寻找全局最优解。不同于遗传算法中只采用一条基因序列,进化策略使用两条基因序列来指导产生新的个体,同时不同版本的进化策略采用不同的种群生成机制使得算法能够适应更多的优化问题。进化策略由于其出色的求解能力在一些优化问题中有着出色的表现。本文提出了一种新的基于自然进化策略的特征选择算法MCC-NES。首先,算法采用了基于对角协方差矩阵建模并通过梯度信息自适应调整参数的自然进化策略;其次,为了使算法能有效地处理特征选择问题,在初始化阶段引入了一种特征编码方式;之后结合分类准确率和维度缩减率给出了算法的适应度函数;此外,面对高维数据引入了合作协同进化的思想,将原问题分解为相对较小的子问题并分别对每个子问题独立求解,然后通过所有子问题相互联系来优化原问题的解决方案;进一步引入分布式种群进化的概念,实现多个种群竞争进化来增加算法的探索能力并设计了种群重启策略以防止种群陷入到局部最优解中。最后将提出的MCC-NES算法与几种传统的特征选择算法在一些UCI公共数据集上进行对比实验,MCC-NES使用CART,Rbf-SVM和KNN分类器来指导学习过程,实验结果显示本文提出的算法可以有效地解决特征选择问题,并且与经典的特征选择算法相比也有一定的竞争力,尤其是在处理高维数据时有着出色的表现。
其他文献
管路系统作为各类设备必不可少的组成部分,担负着动力输送任务,有着构型复杂、长跨度、层叠交错和多支撑的特点。在受到外界载荷、内部流体激励时易发生管路系统的大幅振动、
随着光纤通信技术的不断完善,各类新型光纤器件的研制引起了研究人员的关注。基于光纤设备的光纤传感网络正在蓬勃发展,光纤激光器和光纤传感器在光纤传感网络中发挥着关键作
目标跟踪在过去几十年中备受关注,并且广泛应用于诸如监视,机器人技术和人机交互等众多视觉应用中。尽管相关研究已经取得了许多的进展,但对于减少光照变化,遮挡等众多因素所带来的影响,及保证目标跟踪的实时性,仍然是当前研究的核心问题。近年来,卷积神经网络在各种视觉任务中展示出了其卓越的能力,尤其在目标跟踪中使用效果显著。受益于卷积网络层次化特征抽象表达能力,一些跟踪器将深度特征集成到常规跟踪方法中;在充分
哌嗪类有机胺湿法脱硫作为一种新型的脱硫技术,因其具有脱硫率高、解吸能耗低、脱硫液能循环使用、不易产生二次污染等优点而被广泛使用。本文研究了哌嗪(PZ)、1-(2-羟乙基)哌嗪(H
模具钢是用来制造冷冲模、热锻模、压铸模等模具的钢种。目前模具钢的应用领域在不断扩大。扁钢锭作为板类件的主要原料坯,被称为“万能钢”,在模具制造领域应用广泛。扁钢锭
网络是人们获取信息的重要手段,手机、电脑等移动设备已经成为人们生活中不可分割的一部分,网络文本开始成为人们获取信息、传播信息的主要途径之一,这使得文本数据呈爆炸式增长。如何挖掘出文本数据的规律和隐藏的主题结构,成为机器学习领域的热门问题。主题模型在文本领域有着极为广泛的应用,通过建模可以有效的挖掘出数据中潜在的主题结构。但是传统的主题模型在面对极短的文本(如社交媒体帖子)时,由于文本数据少、上下文
近年来,随着智能网联汽车(Intelligent Connected Vehicles,ICV)的飞速发展,ICV正大量涌入人工驾驶车(Manual Vehicle,MV)车流之中,交通流混行态势逐渐成形。混行环境下异构
光谱分析是人们探索物质结构与特征的有效手段之一,光谱分析是通过分析物质的吸收光谱、发射光谱、荧光光谱等的特性,进而鉴别出物质的成分,确定它化学组成和相对含量。其中,
由于钛合金在航空航天领域及生物医用材料方面的广泛应用,以及非晶合金相比传统合金所表现出来的优异性能,使我们对于钛基非晶合金的性能以及应用有着非常高的期待,因此研究
永磁同步电机具有高效、高功率密度和高转矩密度的特点,因此被广泛运用于车用轮毂电机,成为学者们的研究热点。本文以一台75k W的永磁同步轮毂电机作为研究对象,设计了电机的