论文部分内容阅读
[摘要]本文讲述了如何用多特征选择的方法进行空间搜索找出最佳解,并且如何用混沌优化算法对样本进行更新。混沌是自然界的一种普遍的现象,其遍历性和不重复性为人们所注意,从而形成了一种新的优化算法——混沌优化算法。特征选择就是从一组N个特征中按一定的选择标准选择出一组由n(n [关键词]混沌 混沌优化 多特征 特征选择
1.研究的背景
当代社会正面临着一场信息革命,信息是21世纪最重要的商品。在信息处理中,信息的获取、传输、存储、加工处理及其应用所采用的技术、理论方法和系统都需要由计算机来完成。目前的电子计算机硬件虽有很强的算术和逻辑运算功能,可是它的逻辑推理、判断、并行运算、联想记忆、自适应学习、模糊信息处理等功能仍有很大的局限性,要模拟人的信息处理能力还很难。因此,人们需要研究一种新的“软处理” 、“软计算”的理论方法和技术,来弥补电子计算机硬系统的不足。
2.混沌优化算法和特征选择
(1) 混沌优化。混沌运动具有遍历性、随机性、规律性等特点。混沌运动能在一定范围内按其自身的规律不重复地遍历所有状态。混沌的遍历性特点可被用来进行优化搜索且能避免陷入局部极小状态。因此,混沌优化搜索方法已成为一种新颖的优化技术,混沌优化就是根据其遍历性和规律性特点,采用混沌变量在一定范围内进行搜索,促使混沌变量的搜索跳出局部极小点,最终达到全局最优点。
混沌优化方法的迭代步骤为:
Stepl设置控制误差,给定混沌初始向量,令k=0;
(2)特征选择。特征选择就是一个从原有的特征集合中选择一个(相对某种评价准则)最优特征子集的过程。特征选择的具体过程是:通用的特征选择模型分为四个部分:特征产生、特征评估、终止标准和特征子集测试。在给定子集评估标准和评估终止条件后,首先在原始特征集中产生特征子集成为候选特征子集,然后利用子集评估标准来评估候选子集产生局部最佳特征子集,判断终止条件,逐步迭代形成最终的最佳特征子集。
(3)基于混沌优化的多特征选择的算法思路。
Step1 特征选择向量用一个0/1位串表示(1表示特征被选中,0表示未被选中)随机生成N个初始样本群。最终的最佳样本bestYB和最小评估值bestP。maxD是迭代次数。
Step2 对样本群进行评估,用fisher函数得出每个样本评估值pgz。得出最小评估值zxp的一个做为最佳样本cbest。
Step3 对N个样本通过混沌优化算法的Logistic函数更新出N个新的样本。
Step4 i=1:maxD,组成新的样本群重复第(2)步的步骤进行评估得到其样本群的评估值gxp,找出更新样本的最小评估值newzxp和最佳样本gbest,newzxp和最小的估值zxp进行比较,如果newzxp Step5 迭代maxD次,得到新的最佳样本群及其评估bestP=zxp;bestYB=cbest;
3.结论
本文提出,基于混沌最优化的多特征选择算法是一种能对一个特征集进行特征的选择并取除去特征冗余、提取最优特征的新型智能算法。这种混合算法思路简单、编程容易实现,并且它对于数据的识别更加的精确,比单一的算法更加智能化。
参考文献:
[1] 李兵,蒋慰孙.混沌优化方法及其应用[J].控制理论与应用,1997, 14 (4): 613-615
[2] 梁瑞鑫,郑德玲.基于区间套混沌搜索的混合优化方法[J].北京科技大学学报,2002, 24(3):342-344
[3] 尤勇,王孙安,盛万兴.新型混沌优化方法的研究及应用[J].西安交通大学学报,2003, 37(1): 69-72
[4] 闵四清,陈茵,程雁.数据挖掘—概念、模型、方法和算法[M],北京:清华大学出版社.2003
1.研究的背景
当代社会正面临着一场信息革命,信息是21世纪最重要的商品。在信息处理中,信息的获取、传输、存储、加工处理及其应用所采用的技术、理论方法和系统都需要由计算机来完成。目前的电子计算机硬件虽有很强的算术和逻辑运算功能,可是它的逻辑推理、判断、并行运算、联想记忆、自适应学习、模糊信息处理等功能仍有很大的局限性,要模拟人的信息处理能力还很难。因此,人们需要研究一种新的“软处理” 、“软计算”的理论方法和技术,来弥补电子计算机硬系统的不足。
2.混沌优化算法和特征选择
(1) 混沌优化。混沌运动具有遍历性、随机性、规律性等特点。混沌运动能在一定范围内按其自身的规律不重复地遍历所有状态。混沌的遍历性特点可被用来进行优化搜索且能避免陷入局部极小状态。因此,混沌优化搜索方法已成为一种新颖的优化技术,混沌优化就是根据其遍历性和规律性特点,采用混沌变量在一定范围内进行搜索,促使混沌变量的搜索跳出局部极小点,最终达到全局最优点。
混沌优化方法的迭代步骤为:
Stepl设置控制误差,给定混沌初始向量,令k=0;
(2)特征选择。特征选择就是一个从原有的特征集合中选择一个(相对某种评价准则)最优特征子集的过程。特征选择的具体过程是:通用的特征选择模型分为四个部分:特征产生、特征评估、终止标准和特征子集测试。在给定子集评估标准和评估终止条件后,首先在原始特征集中产生特征子集成为候选特征子集,然后利用子集评估标准来评估候选子集产生局部最佳特征子集,判断终止条件,逐步迭代形成最终的最佳特征子集。
(3)基于混沌优化的多特征选择的算法思路。
Step1 特征选择向量用一个0/1位串表示(1表示特征被选中,0表示未被选中)随机生成N个初始样本群。最终的最佳样本bestYB和最小评估值bestP。maxD是迭代次数。
Step2 对样本群进行评估,用fisher函数得出每个样本评估值pgz。得出最小评估值zxp的一个做为最佳样本cbest。
Step3 对N个样本通过混沌优化算法的Logistic函数更新出N个新的样本。
Step4 i=1:maxD,组成新的样本群重复第(2)步的步骤进行评估得到其样本群的评估值gxp,找出更新样本的最小评估值newzxp和最佳样本gbest,newzxp和最小的估值zxp进行比较,如果newzxp
3.结论
本文提出,基于混沌最优化的多特征选择算法是一种能对一个特征集进行特征的选择并取除去特征冗余、提取最优特征的新型智能算法。这种混合算法思路简单、编程容易实现,并且它对于数据的识别更加的精确,比单一的算法更加智能化。
参考文献:
[1] 李兵,蒋慰孙.混沌优化方法及其应用[J].控制理论与应用,1997, 14 (4): 613-615
[2] 梁瑞鑫,郑德玲.基于区间套混沌搜索的混合优化方法[J].北京科技大学学报,2002, 24(3):342-344
[3] 尤勇,王孙安,盛万兴.新型混沌优化方法的研究及应用[J].西安交通大学学报,2003, 37(1): 69-72
[4] 闵四清,陈茵,程雁.数据挖掘—概念、模型、方法和算法[M],北京:清华大学出版社.2003