论文部分内容阅读
遗传算法是一种借鉴生物界自然选择和进化机制发展起来的高度并行的随机自适应搜索算法,是由美国的Holland教授首次提出的。近年来众多研究者不断的对其进行改进和发展,并将其广泛应用于那些难以用传统方法进行求解的复杂问题,如组合优化、模式识别、图像处理、数值优化等。 遗传算法采用简单的编码来表示各种不同问题的复杂结构,对解群体的选择、交叉、变异等遗传操作不依赖于所解的问题,而是简单的按照优胜劣汰的自然选择规律确定搜索方向,是一种有向的随机搜索。从而特别适用于大规模并行处理,具有不受搜索空间条件(如可微、单峰、连续等)的约束及不需要其它辅助信息的特点。这些特点使得遗传算法不仅能获得较高的效率,而且具有简单性,易操作性,全局最优性,隐并行性,鲁棒性及通用性。但是它也存在着收敛速度慢,收敛过程中稳定性差,可控性差和早熟收敛等缺陷。 基于遗传算法的机器学习是将遗传算法与机器学习系统相结合的产物,是当前遗传算法研究的一个重要方面。其中最引人注目的是对分类器系统的研究。竞争的信度分配和以遗传算法为核心的规则发现构成了基于分类器的遗传机器学习系统。1986年Holland等实现了第一个基于遗传算法和桶队列算法反馈机制的分类器系统。 本文将遗传算法与机器学习基本思想相结合,在分类器学习系统的基础上,对遗传机器学习系统进行了一些重要的局部改进,提出改进的遗传机器学习系统。 (1) 增强因子的引入。在信度分配中,对获胜分类器进行奖励,保证了最优个体的存在性,增强了算法的局部搜索能力,使种群向着最优解不断进化. (2)排挤因子的引入.在规则与消息系统和遗传算法过程中均引入了排挤因子.每次机器学习后用最优环境消息替换规则集中最差个体;每次遗传算法后,用交叉操作产生的较优子代替换原种群中与其最相似的最差个体. 排挤因子的引入解决了选择压力与种群多样性的矛盾,不但保证了最优个体的存在性,还没有破坏种群的多样性. (3)合并因子的引入.每次遗传机器学习后对相似分类器进行合并,最终权值取所有相似分类器的平均值.这样防止超级个体的产生,避免了搜索带逐渐变窄而产生的过早收敛,并维持了原来的算法搜索空间. (4)改进系统中对于信度分配的具体计算: 假定一个分类器c在t时刻的权值为S(c,约,投标系数为几记,有效投标中随机噪声为N(a。、),投标税系数为几idta二,存活税系数为q价。二,进行投标未进行投标 1上n︶了!l,、esesL投标控制参数b’二旧优胜者为?n,新胜者为m+1,对优胜者的奖励为侧,收入为州约,且州约二及《二,t) 那么我们就能够得到 分类器C的投标值为B乞d(C,t)=e。:以·S(C,亡)有效投标值为EB:己=B:d+N(a。、。)税值为Tax=Cl:了。乙a二·S+几:己亡a二·b‘·S候选分类器C参加投标一条消息后,它的权值为S(C,t+l)=S(C,亡)一B乞d(C,t)一T(C,t)+R(亡)有效投标最大者为当前优胜者,其权值为S(。+l,亡+1)=S(。+l,亡)一B:d(m+1,亡)一T(m+1,t)+R(艺)+R‘ 定理1.1当分类器的回报趋于稳定时,投标值接近于回报值. 定理表明在分类器系统中,规则的权值是否处于稳定状态,对遗传算法的学习过程很大影响. 经实践我们发现如此将遗传算法与机器学习相结合是非常有效的.机器学习对一些函数关系很明确的数据收敛速度很快,而对于一些函数关系不是很确定的例子来说其表现就不是很理想了,机器学习会产出摆动,不够精确,甚至陷入局部极小;而此时遗传算法就会表现出其优势,遗传算法根据要求建立一个规则重组机制,并且根据这个机制来对规则进行重组,产生新的,可能性能更好的规则,并淘汰不好的规则,跳出局部极小的圈子,扩大搜索范围,加速向最优解逼近.这样两种保证收敛的算法相结合,更加保证了整个算法的收敛性,加速算法收敛速度,是很有效的组合. 对于本改进的遗传机器学习系统,将遗传算法与机器学习有效的结合起来,并辅以改进因子,令二者交替进行,在程序运行的前期,由于要求的相似度较低,分类器投标活跃,机器学习占主导地位;而在后期,机器学习到了一定程度,遗传算法就相应的占了主导.这样更加保证了算法的稳定性,收敛性,全局搜索性,克服了非成熟收敛等弊病.改进算法不要求所要解决问题目标函数的连续性,凸性,光滑性等,特别适用于维数高,总体大,环境复杂,问题结构不十分清楚的情况. 最后我仃J将改进的遗传机器学习系统应用于模式识别和多目标优化问题,分别针对疾病的诊断模型和投资的收益与风险模型,给出了具体的算例. (一)改进的遗传机器学习系统在模式识别中的应用. 改进的遗传机器学习系统具有强大的学习功能,是解决模式识别问题的有效工具.用它来解决医学诊断中的数据优化问题一一用最少的诊断数据得出较为正确的结论,使医学诊断能够更加科学、经济和便捷. 这里以乳腺癌病例诊断为例,由病人的表征输入,产生最可能的疾病状态,实现自动医学诊断. 我们依据已确诊病例信息的编?