基于强化学习的改进遗传算法研究

被引量 : 0次 | 上传用户:jpyssy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
遗传算法(Genetic Algorithm, GA)是进化算法中产生最早、影响最大、应用也比较广泛的一个分支算法。它采用达尔文进化论的适者生存、优胜劣汰的进化思想。作为一种全局搜索方法,它具有简单性、鲁棒性和通用性等特点。自算法提出以来,在工程设计、机器学习、模式识别、图像处理等方面得到了广泛的应用。尽管如此,遗传算法在理论和应用方法上还有很多亟待完善之处,如早熟收敛、收敛速度慢等问题。针对传统遗传算法存在的早熟收敛和收敛速度慢的问题,本文提出了相应的改进方法,其研究内容主要包括以下三个方面:(1)提出了一种多策略选择遗传算法,同时将强化学习算法与多策略选择遗传算法融合。该算法通过使用不同的选择策略提高了种群的多样性,有效地避免了遗传算法的早熟收敛问题,并运用强化学习算法动态地优化种群多样性,使其保持在合适的范围,一定程度上增强了算法的自适应能力。实验证明,该算法在收敛速度和搜索效率上都表现出了较好的性能。(2)借鉴精英策略和协同进化思想,提出了一种双精英协同进化遗传算法,并从理论上证明了算法的收敛性。通过对函数进行测试,实验结果表明,该算法能搜索到几乎所有函数的最优解,同时能有效地保持种群的多样性。与已有算法比较表明,该算法在收敛速度和搜索全局最优解上都有了明显的改进和提高。(3)为进一步完善双精英协同进化遗传算法的自我进化机制,增强算法的可靠性和自适应性,将强化学习算法应用到双精英协同进化遗传算法中。实验结果表明,强化学习中的Q-learning算法与遗传算法结合能较好地克服遗传算法自身的随机性,为遗传算法与其它强化学习算法的结合做了铺垫。
其他文献
2001年教育部颁布了《全日制义务教育数学课程标准(实验稿)》,对于中小学教材,国家鼓励有关机构和出版部门根据课程标准组织编写,原有的人教版独揽天下的局面被打破,出现了如
<正>普陀山是中国佛教四大名山之一,也是海上丝绸之路的一颗明珠。普陀山位于浙江省舟山群岛东部,四面环海,呈菱形,南北长,东西窄,面积12.5平方公里,岸线长30公里,以海天佛国
从18世纪初的"南海泡沫"到2008年的世界金融危机,已经充分表明构建合理的监管模式、监管制度是保证资本市场乃至全球经济健康发展的前提,尤其对位于金字塔底基部位的场外交易
目的:探讨埋线与电针治疗单纯性肥胖症的疗效差别。方法:采用埋线、电针分别对两组单纯性肥胖症患者进行治疗,电针组20次1疗程,埋线组6次1疗程,均接近2月治疗后总结疗效,观察
随着市场经济的发展和资本化的不断深入,历史成本计量模式已经无法满足企业会计核算的需求,公允价值计量模式的应用更有利于投资者的投资决策,提高会计信息的决策相关性。尤
目的 探讨急诊专科护士对急性冠脉综合征(ACS)行急诊冠状动脉支架植入术(PCI)的护理干预对保证急救路径快速有效实施的作用.方法 选取97例急性冠脉综合征患者,随机分为观察组和对
<正> 1983年以前,长春自来水公司只有一个十分简陋的托儿所,不仅条件差而且缺少玩、教具,人员紧张,师资不足,更谈不上儿童的保健工作了.1984年以来公司领导把托儿所工作纳入
塑料注射成型技术及设备的出现始于二十世纪三十年代,在仅有七十年左右的时间已发展成为一种非常重要、最具代表性的塑料加工方法和机种,注塑制品也为越来越多的行业采用。注射
目的:通过对26个常染色体非CODIS-STR基因座在中国汉族人群中的多态性调查和建立67个X-SNP位点的MALDI-TOF MS检测技术,为疑难亲权鉴定案件如突变案例、特殊排除案例、祖母与
本课题以苏州大学SMT实验室报废的Quad QSP-2型贴片机为研究平台,在原有设备及更新控制系统硬件和自主研发底层驱动软件基础上,研究和搭建了贴片机的机器视觉系统。本课题设