【摘 要】
:
高维数据集引起的“维数灾难”问题不仅增加了计算内存和运行时间,而且会导致学习器分类性能的下降。而特征选择技术通过排除冗余和不相关的特征来减少数据维度,从而提高学习算法的性能。但在特征选择中,寻找最优特征子集是一个NP难问题,使用传统的贪婪式搜索方法极易陷入局部最优。而群智能算法中的蚁群优化算法因其出色的全局和局部搜索能力和灵活的图形表示方式而广泛应用于特征选择。但是当前基于蚁群算法的特征选择方法主
论文部分内容阅读
高维数据集引起的“维数灾难”问题不仅增加了计算内存和运行时间,而且会导致学习器分类性能的下降。而特征选择技术通过排除冗余和不相关的特征来减少数据维度,从而提高学习算法的性能。但在特征选择中,寻找最优特征子集是一个NP难问题,使用传统的贪婪式搜索方法极易陷入局部最优。而群智能算法中的蚁群优化算法因其出色的全局和局部搜索能力和灵活的图形表示方式而广泛应用于特征选择。但是当前基于蚁群算法的特征选择方法主要应用于低维数据集。对于高维度的数据集,特征选择的搜索空间呈指数增长,因此搜索最优特征子集变得极为困难。在本文中,我们提出了一种用于高维特征选择的两阶段混合蚁群优化算法。具体研究内容如下:(1)针对基于蚁群算法的两种常用的特征搜索空间的表示方式,通过实验分析确认在高维特征选择中全连接表示方式更为合适。此外,利用特征间固有的相关性属性来加速最优特征子集的搜索,并使用分类器评估进一步提升特征子集的分类性能,实验结果显示使用混合模型的蚁群算法相比单一模型方法更为优秀。(2)针对在高维数据集中通过人为的先验知识来确定选择的特征数目是很困难的,我们提出了两阶段蚁群算法,即在第一阶段通过区间策略来确定用于后续特征子集搜索阶段的特征数目。与确定最优特征子集大小并同时搜索的传统一阶段方法相比,提前评估部分特征数端点性能的额外阶段有助于降低整体算法的复杂性并缓解算法陷入局部最优。在十一个高维公共数据集上的测试结果表明,所提方法获得的特征子集在大多数数据集上具有最优的分类性能,且与其他基于蚁群算法的特征选择方法相比,运行时间也更短。(3)针对蚂蚁间几乎没有相互学习而只有迭代信息的学习,从而降低了算法全局搜索能力的问题,我们利用遗传算法中的交叉算子与种群中的特征访问次数设计了基于特征选择的交叉算子,使得选择出的特征子集的分类性能有了进一步的提升。此外,与传统常用特征选择方法相比,改进的两阶段混合蚁群算法更适合于高维特征选择。
其他文献
为查明延安西部地区马五1+2亚段低幅度构造成因及其与油气富集的关系,研究在采用趋势面分析法对现今低幅度构造精细识别的基础上,开展了古地貌与现今构造对比,结合钻井、测井、试气以及铸体薄片资料对正向低幅度构造成因及石油地质意义进行了初步探讨。结果表明:①本区马五1+2亚段顶面共发育10处正向低幅度构造,形态以鼻隆为主,构造轴线具有近东—西、近北东—南西、近北西—南东3种走向;②现今西倾单斜背景下的正向
20世纪70年代,世界范围内社会、经济与政治领域的一系列变革促使博物馆、遗产地等文化展示场所将目光转向"体验"。体验不仅代表一种与过去对话的新方式,而且也是文化产业兴起后的必然之路。在这种情况下,博物馆对实物收藏、保护、研究的关注转至观众的兴趣、行为、参观效果上。相应地,体验成为博物馆实现其公共使命、树立博物馆形象的手段。然而,体验是否真如人们所描绘的那样美好?在《转型期博物馆的哲学观察》一书中,
嵌入式Flash存储器是一种广泛应用的非易失存储器,很多MCU以及IoT芯片都在内部集成了Flash。Flash作为Memory的一种类型,其无需电源即可保持数据,与传统硬盘相比传输速度更快、功耗更低、体积小、不易损坏、且价格更低,已经被广泛使用作为SOC芯片中的存储器件。由于嵌入式Flash的接口协议不同于标准AMBA总线接口,为了将其集成到SOC中,需要设计控制器实现两种协议的转换,完成Fla
随着半导体技术的高速发展,模数转换器(ADC)作为通信、视频传输等领域的重要组成部分,ADC的精度、速度要求也随现今的发展有着更为严苛的规定。在众多的ADC结构里,算法ADC具备着高精度、低功耗、低成本的设计优势。因此本文针对高精度低功耗算法ADC进行了相关的研究。论文首先介绍了本课题的研究背景以及意义,并对算法ADC的基本特性进行了分析;其次对传统的算法ADC进行了改进,使用了冗余符号位编码(R
超高清视频是继视频数字化、高清化之后的新一轮重大技术革新,将带动产业链各环节发生深刻变革。但超高清视频数据量巨大,导致对其传输、存储和处理压力巨大。在带宽有限的情况下,视频传输帧率往往为30 Hz或者60 Hz。但由于播放设备往往存在差异,主流显示设备的刷新率一般为60 Hz,少数高端产品会有刷新率更高的屏幕。由于片源和屏幕之间的刷新率存在差异,会出现例如拖影、停顿、模糊等现象,使得我们观看的视频
二氧化钛(TiO2)是一种非常重要的宽禁带(~3.0-3.2 e V)半导体材料,由于其经济无毒且具有物理化学性质稳定的特点,而被广泛应用于紫外探测、光催化和环境能源再生及保护等各个领域。但由于TiO2对可见光吸收有限且其性能受形貌及晶型影响较大,严重阻碍了TiO2在各领域的应用。近年来,为提高TiO2对整个太阳光波段的光谱吸收,科研工作者主要采用以下三种方式提高其性能,(1)控制形貌:低维纳米线
Al Ga N/Ga N异质结具有很强的自发和压电极化效应,即使在没有任何掺杂情况下,只有极化应力也能在Al Ga N/Ga N异质结界面的量子阱中产生高密度的二维电子气体。Al Ga N/Ga N HEMT在高频电子器件和高功率中具有很大应用潜力。然而,在高功率器件应用中,Al Ga N/Ga N HEMT的结温持续升高成为制约其进一步发展的瓶颈。传统衬底上的Al Ga N/Ga N HEMT具
合成孔径雷达(Synthetic Aperture Radar,SAR)是一种成像分辨率高、全天时、全天候、作用距离远的微波成像系统,凭借其诸多优点合成孔径雷达在军用和民用领域发挥着巨大作用。在追求合成孔径雷达技术应用能力不断提高的大环境下,合成孔径雷达工作模式目前已经发展出条带模式、聚束模式、滑动聚束模式、扫描模式、循序扫描地形观测等工作模式。滑动聚束模式既解决了条带模式下方位向分辨率受限问题,