基于启发式算法的特征选择方法研究

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:haozhizhegogo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,人们面对数据的体量变得越来越大,但数据的价值密度越来越小,这使得从数据中挖掘价值变得越来越困难。在机器学习中,对象通常包含大量特征,其中可能只有一小部分特征对学习结果有影响。从大量特征中筛选出有用特征,能够有效降低数据维度,提高机器学习的效率。但特征集的子集数量随特征数量增长而呈指数级增长,传统的特征选择方法无法应对大数据环境下解空间组合爆炸的问题。针对高维特征选择问题中的难点,本文利用启发式算法的高效搜索能力,提出了一种基于启发式算法的特征选择方法,以及一种基于启发式算法的生成对抗网络训练方法,并将二者结合用于不平衡数据分类。本文的主要成果和创新点如下:(1)提出了一种灰狼-水波混合优化算法,将原始的灰狼优化算法(Grey Wolf Optimization,GWO)与水波优化算法(Water Wave Optimization,WWO)进行混合,在没有影响原始灰狼优化算法全局搜索能力的情况下,增强了其局部搜索能力,并将其应用在特征选择中,实验结果表明该方法显著地提升了普通分类器的分类准确率。(2)设计了一个基于特征选择的Wasserstein生成对抗网络模型(WGAN-EFS),在生成器和判别器的对抗训练中加入了数据的特征选择,并利用启发式算法优化了生成对抗网络的结构。测试了多种启发式算法,其中生态地理学优化算法(Ecogeography-Based Optimization,EBO)对生成对抗网络的结构优化以及数据的特征选择表现出了较好的能力,并将该模型应用于高维的不平衡数据的分类,通过该网络改变不平衡数据的比例,实验结果表明该方法显著的提高了不平衡数据在分类上表现。
其他文献
作为生物特征识别技术中最具代表性的方法,人脸识别技术获得了广泛的关注与研究。随着科技的不断发展和完善,人脸识别技术在公共安全、移动支付等领域获得了广泛应用。作为深
本文基于TRMM卫星降水资料,NCEP再分析资料以及区域谱模式(RSM)细网格再分析资料以及RSMC最佳路径集(Best-track Dataset)资料,统计分析了1998~2013年间变性TC(热带气旋,Tropi
随着信息技术与计算机技术的快速发展,物联网作为信息技术的第三次革命已经逐步深入到我们生活中的各个领域。由于物联网中的计算设备资源有限,传统的密码算法已经不能解决该领域中的安全问题,由此轻量级分组密码算法应运而生。轻量级分组密码算法具有执行效率高,资源消耗少,吞吐量低和软硬件实现效率高等优点,在物联网的安全领域发挥着重要的应用,因而其安全性分析已成为密码学研究的主流。故障分析应用于密码算法的安全性分
腓力二世所在的马其顿王室的早期历史是晦涩的,半传说性质的。公元前五世纪中期,希罗多德在其《历史》中讲述了马其顿阿吉德王朝王室的起源故事。相传,马其顿王室的首位国王佩尔狄卡斯来自希腊南部的阿尔戈斯,他是阿尔戈斯特墨诺斯的后代,逃亡到马其顿并在此地建立自己的统治。希罗多德之后的几个世纪,马其顿王室的起源故事的内容发生变化,其情节与人物都与希罗多德版本的记载发生矛盾。本文以古代流传下来的马其顿王室起源记
一般认为,侵权人的行为故意或过失违反了法律规定,对他人的权益造成损害,则侵权人须对受害人承担责任并给予赔偿。根据侵权法中的损害填平原则,由加害人完全填补受害人的损失
当今社会日新月异,新的事物和观念不断涌现,而人们往往会把这些新事物与自身的内部词汇网络相联系,从而赋予了旧的词语新的意义,“旧词新义”的现象由此产生。“旧词新义”作
当人类对物质的认识达到微观原子尺度,各学科面对的物质基础是一样的,这致使传统学科如物理、化学、生物等学科之间的界限已经逐渐消失。物质最基本的结构都是电子绕原子核运
移动机器人研究领域包含很多子问题,其中定位与建图问题是实现机器人自主运动和避障功能所必须解决的关键问题。机器人在室外运动可在很大程度上依赖全球定位系统(GPS)提供的
职务发明制度是专利立法的重要基石,也是保证国家科技创新的重要方式。职务发明制度的初衷是为了在发明人和本单位的利益之间找到最好的平衡点,充分发挥职务发明的价值。本文
夫妻共同债务制度是婚姻法的核心问题之一。对夫妻共同债务的认定、处理等法律问题,不仅仅关系到夫妻之间配偶一方的权益,更关涉到第三方债权人的利益,关系到交易的安全和社