基于基因锁定及链式智能体遗传算法的特征选择研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:miaohaikun0
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
特征选择是模式识别、数据挖掘的重要数据预处理方法。研究对象的特征维数随着所描述对象复杂程度递增而增高,由于大量高维数据对象的特征空间中含有许多冗余特征甚至噪声特征,所以运用特征选择方法减少这些冗余或噪声特征,来降低搜索时间和提高搜索效果已成为特征选择的研究热点。通常降低搜索时间和提高搜索结果的“满意性”(满意性即能够满足实际工程要求的特征子集性能)是矛盾的。论文将遗传算法用于特征选择的搜索中,针对工程中对实时性和满意性的不同要求,研究相关算法,主要工作和结果如下:1.针对实时性要求强的,高维特征集进行满意特征子集选择的时候,传统的特征选择方法执行时间很长,算法执行效率低的问题,提出了基于基因锁定位遗传算法GLGA(Gene-Lock Genetic Algorithm)来进行特征选择,该算法引入基因锁定位算子,避免了对基因的重复搜索;采用基于特征标志位寄存器状态的自适应结束条件,加快了算法的收敛速度。2.针对网络式环境(Lattice)遗传算法搜索结果不能较好地满足实际工程需要的问题,提出了基于链式智能体遗传算法LAGA(Link Agent Genetic Algorithm)的特征选择方法。该算法采用链式智能体结构,取代了Lattice智能体结构,有助于减小计算代价,保持种群多样性;采用动态竞争的选择策略,既可以自适应扩大搜索范围,又实现了局部寻优,提高了搜索效率;采用自适应交叉、变异算子,有效的保持了种群多样性,提高了搜索满意度。3.文中选择了国际通行的机器学习数据集UCI(University of California, Irvine)中的两个数据集进行实验。分别将GLGA和LAGA与其它三种遗传算法进行比较,且运用了三个不同的评价准则分别结合四种算法进行了特征选择能力实验和BP神经网络分类结果比较实验。实验表明:①GLGA算法的执行时间短,执行效率高,能够用于实时性强的特征选择问题。并且,该算法所选出的特征子集的识别准确率也与其它三种特征选择算法选出的结果相当,有时甚至更高些。对于高维特征集,GLGA算法还具有显著的降维效果,能够明显降低网络分类器维数的复杂度。②LAGA算法所选择的结果优于使用其他三种算法进行特征选择的结果。通过该算法选择得到的满意特征子集具有较好的稳定性,较高的识别准确率和较低的网络分类器维数复杂度。
其他文献
超宽带通信具有通信容量大、保密性好、平均功率密度小、抗多径能力强等许多优点,是目前短距离高速无线通信系统实现的有力竞争方案。作为超宽带系统的重要组成部分,超宽带天线
气孔是陆生植物与外界进行水分和气体交换的通道,是植物登陆并适应陆生环境最关键的革新性状之一。气孔的发育过程与功能随着植物的演化变得越来越复杂和高效。因而,研究与气孔
SIDO开关变换器由于省去了一个片外电感,降低了系统的复杂度和成本,近年来在电源管理领域中得到广泛关注。采用多模式控制可以更加灵活、高效地为SoC系统的各模块供电,故多模
转录激活因子4(Activating transcription factor4,ATF4)参与多种生物学过程,包括炎症应答、氨基酸代谢、内质网应激、脂质代谢和能量稳态调控。然而,ATF4在炎症性肠炎(inflammat
三维立体显示技术是当今一个引人注目的前沿科技领域,而全息术因可以记录和再现物体发出的光波,并能提供物体的全部深度信息而被认为是理想的三维显示技术。基于空间光调制器的
计算电磁学是融电磁场理论、数值方法、计算机技术于一体的新兴交叉科学,其学术价值和工程意义已逐步凸现。以建模、仿真、优化、设计为流程的电磁场工程已经渗透到工业领域
短命植物(Ephemerals)是一类生长在荒漠地带或中生落叶林下的生活周期或年生长期很短的特殊植物类群的总称,在生态系统中具有重要作用。为了适应严酷的生长环境,短命植物具有诸
学位
微丝骨架在花粉管的极性生长过程中发挥着重要的调控作用。花粉管不同区域有明显不同的微丝排布。目前人们对在花粉管主干部位形成的微丝束的结构及其功能已有较多的了解,而对
Sigma-Delta模数转换器(Sigma-Delta ADC)采用过采样以及Sigma-Delta调制技术来实现模数转换,具有转换精度高的特点,非常适合用来实现数字通信系统和音频信号处理系统中的模