基于差分进化算法的特征选择方法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:crazyasp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络科技的发展,数据已经成为一种可利用的资本,这为数据挖掘技术的发展带来了机遇和挑战。现实世界中,数据本质上是复杂的,而大量的特征又增加了复杂性的挑战。因此,如何去除冗余数据并保留相关数据已经成为了数据挖掘与机器学习任务的研究热点。在现实任务中,为了避免数据维度灾难问题,去除不相关特征降低数据处理任务难度,特征选择技术被用来作为能够保留语义的预处理过程。特征选择主要依据数据的分布特点,利用合适的搜索机制和适应度函数从原始特征集合中选择出一个最优或具有相似效果的特征子集,从而在时间、空间及数据分析结果等方面获得提升。特征选择算法的研究主要分为两个方面:搜索策略和评价标准。本文利用信息论、皮尔逊相关系数相关技术作为评价标准,将改进差分进化算法作为搜索机制对特征选择进行优化。主要做了以下两部分工作:(1)提出基于改进自适应差分进化的特征选择算法(ISHADEFS)。首先,在特征选择评价标准方面,为提高评价标准影响力以及特征选择准确性,设计实现了一种互信息与皮尔逊相关系数增强效果的适应度函数。其次,为了解决差分进化算法中种群多样性和收敛性之间相矛盾的问题,提出了三角形变异算子。设计基于阈值的变异策略,将两种变异算子通过阈值进行选择。最后,进行实验验证。通过分析算法适应度函数曲线,得到变异策略的最好阈值以及适应度函数的影响因子。将ISHADEFS算法与现有特征选择方法在不同分类器上进行对比。实验结果表明,本文提出的ISHADEFS算法可以选择较少的特征,并获得更好的分类效果。(2)提出基于改进多目标差分进化的特征选择算法(IMODEFS)。首先,将特征选择建模为多目标优化问题,考虑特征之间的相关性和冗余性来处理不需要的特征。其次,为提高种群多样性,设计了协同变异策略,通过设置阈值将具有快速收敛速度的“current to pbest”与变异算子DE/rand/1进行协同变异操作,从而更好的选择变异算子。最后,本文通过实验分析IMODEFS算法的帕累托前沿证明了该算法能够提供充足的种群帕累托前沿。将IMODEFS与现有特征选择算法进行实验对比,结果证明了本文所提出的IMODEFS算法在分类性能和寻优性能等方面优越性。
其他文献
随着存储数据的剧增,系统中的数据失效情况频发。现有的容错手段主要包括副本冗余和纠删码两种,纠删码因其具有相较副本存储开销小的优点成为存储系统中重要的容错策略,数据重构是纠删码解决问题的重点,其针对重构技术的研究主要从编码方案和重构过程两个方面展开。纠删码中的分组码通过将数据块分组降低数据重构时读取数据量,编码结构简单,但现有分组码各分组之间由于关联性差会导致容错率降低等问题,且目前关于分组码在重构
机器人自主定位和导航是机器人领域的一个重要研究方向。机器人定位方式又可分为局部定位(如基于马尔科夫链的SLAM(Simultaneous Localization And Mapping)里程计的相对位置的确定)和全局定位(如有额外的地图辅助的绝对位置确定)。局部定位方式因其定位原理会造成定位误差累积;而地图包含环境中目标的精确位置信息,能够提供可靠的绝对位置。地图现有形式中,栅格地图、拓扑地图等
钇稳定氧化锆(Yttria stabilized zirconia,YSZ)基固体电解质传感器因具备抗水蒸气干扰能力强、选择性好、响应快、结构简单、寿命长等优点,近年来成为挥发性有机物(Volatile Organic Compounds,VOCs)气体检测方面的研究热点。但是从国内外的研究中可以发现,基于氧化锆电化学气体传感器对甲醛气体的灵敏度较低,距实现室内痕量甲醛气体的有效检测还存在一定的距
互联网的迅猛发展,促进了互联网广告业的发展,网络广告占据了整个网络,如今大多数网站都或多或少包含某种广告。广告虽然可以为网站或企业带来收益,但是也给网络用户获取有用信息造成了干扰,因此,研究如何识别网络中的广告具有十分重要的意义。对于目前广告商使用较多的图片广告和文本广告,已有的图片广告识别大多通过规则匹配来完成,需要经常更新规则,实时检测的效率还需提高,基于多维特征的识别方法,特征提取较为复杂;
智能汽车作为缓解当前交通压力的重要方式,凭借事故率低,能源消耗少,驾驶舒适性高等优点,逐渐成为高校与企业的研究热点。随着智能汽车研发推进,其应用场景日益复杂,安全舒适性需求不断增加,且受限于早期车载传感器种类单一,模型参数化方案缺少模仿人类驾驶潜力,早期智能驾驶研发主要追求辅助驾驶功能实现,缺乏模仿人类驾驶的项目研究,故为完善“人-车-路”协调统一的智能交通系统,仍需不断引入新的技术手段。近期量产
深度强化学习是当前人工智能研究领域新的热门方向,它将深度学习的感知能力与强化学习的决策能力相结合,以端对端的形式实现了从原始输入到输出的直接控制。提出至今,已经在众多决策控制和需要对高维原始输入数据感知的任务中得到应用,尤其是在指挥决策领域,获得了实质性的突破,然而当前的深度强化学习算法在指挥决策的过程中仍然存在数据利用率低、学习出的策略不稳定以及在欺骗性或稀疏环境中陷入局部最优、长期无法获得奖赏
随着社会的发展和科技的进步,越来越多的人开始关注人体健康。实时、准确、高效的人体姿态识别,可以被广泛应用在个人与家庭的健康监护、人机交互、医疗康复、虚拟现实、舞蹈采集、影视制作与步态识别等方面。近年来日益普及的智能手机,已经成为人们日常生活的重要组成部分;种类繁多、功能强大的嵌入式传感器使得智能手机成为一个无处不在的数据获取和分析平台,这也为高效的人体姿态识别提供了巨大的潜力,因而通过智能手机传感
随着网络技术的迅猛发展,用户可以在日常生活中同时使用多个在线社交网络享受服务。与此同时,社交网络服务平台种类繁多,逐渐形成一个庞大的社交网络结构。从整体来看,大多数的社交网络都是异质社交网络,异质社交网络中的实体主要包括用户、位置、文本等。异质社交网络实体锚链接识别可以推动社交网络的发展,并不断完善社交服务平台,是社交网络中的重要研究内容。本文主要针对异质社交网络中的用户和位置这两类实体的锚链接识
随着互联网技术的高速发展,网络威胁态势随之愈发严峻,网络威胁情报信息作为网络安全保障组织获取网络威胁的重要来源,具有极为重要的研究价值。因此研究如何在P2P交易场景下进行高效、安全的网络威胁情报信息交易,成为网络威胁情报信息交易的重要研究内容。在分布式环境下的多中心化的联盟链使用节点的审核加入机制,解决了联盟链内节点的信任问题,为面向P2P交易的网络威胁情报信息交易提供了可行的解决方案。研究如何提
在科技相对发达的今天,科技为人类生活提供了诸多便利,同时科技也充分融入到战争领域中。战争已经从肉搏为主要形式转变成科技之间的博弈。科技在战争中扮演着“矛”与“盾”两个角色,我国一直以维护世界和平、促进共同发展为己任,不求“矛”尖锐,但求“盾”坚固。秉承和平发展的主要思想,借助科技的力量,本文提出一种基于贝叶斯推理的目标意图识别方法,意在以人工智能的方法为分析空中目标的意图提供了新的方法,以科技力量