基于基因锁定及链式智能体遗传算法的特征选择研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:miaohaikun0
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
特征选择是模式识别、数据挖掘的重要数据预处理方法。研究对象的特征维数随着所描述对象复杂程度递增而增高,由于大量高维数据对象的特征空间中含有许多冗余特征甚至噪声特征,所以运用特征选择方法减少这些冗余或噪声特征,来降低搜索时间和提高搜索效果已成为特征选择的研究热点。通常降低搜索时间和提高搜索结果的“满意性”(满意性即能够满足实际工程要求的特征子集性能)是矛盾的。论文将遗传算法用于特征选择的搜索中,针对工程中对实时性和满意性的不同要求,研究相关算法,主要工作和结果如下:1.针对实时性要求强的,高维特征集进行满意特征子集选择的时候,传统的特征选择方法执行时间很长,算法执行效率低的问题,提出了基于基因锁定位遗传算法GLGA(Gene-Lock Genetic Algorithm)来进行特征选择,该算法引入基因锁定位算子,避免了对基因的重复搜索;采用基于特征标志位寄存器状态的自适应结束条件,加快了算法的收敛速度。2.针对网络式环境(Lattice)遗传算法搜索结果不能较好地满足实际工程需要的问题,提出了基于链式智能体遗传算法LAGA(Link Agent Genetic Algorithm)的特征选择方法。该算法采用链式智能体结构,取代了Lattice智能体结构,有助于减小计算代价,保持种群多样性;采用动态竞争的选择策略,既可以自适应扩大搜索范围,又实现了局部寻优,提高了搜索效率;采用自适应交叉、变异算子,有效的保持了种群多样性,提高了搜索满意度。3.文中选择了国际通行的机器学习数据集UCI(University of California, Irvine)中的两个数据集进行实验。分别将GLGA和LAGA与其它三种遗传算法进行比较,且运用了三个不同的评价准则分别结合四种算法进行了特征选择能力实验和BP神经网络分类结果比较实验。实验表明:①GLGA算法的执行时间短,执行效率高,能够用于实时性强的特征选择问题。并且,该算法所选出的特征子集的识别准确率也与其它三种特征选择算法选出的结果相当,有时甚至更高些。对于高维特征集,GLGA算法还具有显著的降维效果,能够明显降低网络分类器维数的复杂度。②LAGA算法所选择的结果优于使用其他三种算法进行特征选择的结果。通过该算法选择得到的满意特征子集具有较好的稳定性,较高的识别准确率和较低的网络分类器维数复杂度。
其他文献
SIDO开关变换器由于省去了一个片外电感,降低了系统的复杂度和成本,近年来在电源管理领域中得到广泛关注。采用多模式控制可以更加灵活、高效地为SoC系统的各模块供电,故多模