RLGA:一种基于强化学习机制的遗传算法

来源 :电子学报 | 被引量 : 0次 | 上传用户:a2854831
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分析了强化学习与遗传算法工作机制,在提出基因空间分割概念的基础上,提出了一种将强化学习与遗传算法内在结合起来的算法RLGA,在遗传算法的框架下实现强化学习机制.从理论上分析了RLGA的收敛性,讨论了RLGA的时间和空间效率及其与基因空间分割的关系,通过实验分析了RLGA中基因空间分割的指导范围.实验结果表明,RLGA具有良好的全局收敛性能. The working mechanism of reinforcement learning and genetic algorithm is analyzed. Based on the concept of gene space segmentation, an algorithm called RLGA, which combines the inherent of reinforcement learning and genetic algorithm, is proposed to realize the reinforcement learning mechanism under the framework of genetic algorithm. The convergence of RLGA is analyzed, the temporal and spatial efficiency of RLGA and its relation with gene segmentation are discussed, and the guiding range of gene space segmentation in RLGA is analyzed experimentally.The experimental results show that RLGA has good global convergence performance.
其他文献
文章提出了化学教师教学效能感的结构,在参考其他相关量表的基础上,自行编制了化学教师教学效能感问卷。对142位化学教师的教学效能感进行了调查,分析了问卷的信度和效度,并
大规模多维网络伪装入侵常指那些非合法用户伪装成授权用户,进入系统查看重要信息或盗取关键信息的违法行为,大部分伪装检测方法要通过获取用户敏感信息来检测,检测率低并误
未来高技术条件下的局部战争有其突发性,短时间内会出现大量伤员,且伤情、伤类复杂,伤势严重,给一线救治及后送带来很大困难.为提高战伤救治能力,我们调研了国内外文献及一线
随着医学科学技术的不断发展,腹腔镜在临床中应用越来越广泛.妇科腹腔镜手术具有损伤小、切口小、术后患者痛苦少、恢复快等优点,已逐渐替代一些剖腹术,现将有关护理体会介绍
45年前,美国麻省理工大学率先开展本科科研教育,成功培养了一批高素质、创新型人才。18年前,清华大学开启"学生科研训练计划",拉开了中国本科科研教育的序幕[1]。当今是创新与
主动脉夹层(AD)是一种极其凶险的大血管疾病,起病急骤,死亡率高.典型的主动脉夹层表现为主动脉内膜撕裂,血液涌入中膜内,主动脉中膜沿长轴分离,形成假腔.其发病机制尚不明确.现
对26年生楠木人工林和杉木人工林生物量及土壤肥力进行调查,以研究楠木人工林培肥土壤功能,结果表明:营造楠木人工林后林地土壤水稳性团聚体含量增加,团聚体的稳定性增强,容
委婉语是随着社会发展和文明进步普遍存在一种语言文化现象。文章结合具体语料对英语中委婉语的种类和功能进行分析,以加深英语学习者对西方文化的了解,消除他们在跨文化交际
档案信息化建设是档案工作适应髙校发展的必然趋势,作为髙校档案的重要组成部分的学籍档案,更是一个面向社会的信息平台.文章从学籍档案信息化的内涵、资源建设和学籍档案信
分析了有限时段和无限时段具有容量约束的连续时间确定性时齐库存系统的最优存储和容量扩张联合决策问题.首先证明在有容量约束的情况下等时间间隔补充策略最优.在此基础上,