强化学习研究综述

来源 :指挥控制与仿真 | 被引量 : 0次 | 上传用户:tianbentb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
强化学习是机器学习领域内的研究热点,主要用来实现决策优化。首先介绍了强化学习的基本原理和经典算法,包括基于值函数的强化学习算法和基于直接策略搜索的强化学习算法;然后针对强化学习目前受关注较多的3个方向:深度强化学习、元强化学习和逆向强化学习分别进行阐述。最后总结了强化学习目前已有的应用和未来可能发展的方向。
其他文献
随着时代的进步和信息技术的发展,初中道德与法治课堂的教学模式也不在单一化,变得丰富多彩。道德与法治作为一门理论性比较强的学科,初中生学起来很容易感到单一和乏味,因此
防空预警雷达阵地选址的优劣直接影响雷达本身及防空武器作战效能的发挥.为在雷达阵地选址中快速处理繁多的数据和进行定量分析,减少人为主观因素,给出了防空预警雷达阵地选
初中英语在英语学习过程中扮演承接小学英语,开启高中英语的重要角色,小学阶段接触的阅读题材较少,初中阶段想要提高学习成绩和教学效果,就必须重视学生阅读理解习惯和能力的
目的:统计分析急性呼吸道感染患儿5种常见呼吸道病毒特异性Ig M的检出情况用以指导临床。方法:2012年1月~12月我院儿科住院急性呼吸道感染患儿1 609例,收集血清采用间接免疫
为了客观定量评价数码仿造迷彩的伪装效果,根据人眼视觉特性,提出基于HSV颜色空间亮度差的权重因子对SSIM算法加权进行了改进,得到了从人眼视觉特性上客观定量评价数码迷彩图案
数学是小学教学中一门重要的基础性学科。通过高效地开展数学教学,能够有效地锻炼学生的思维能力与创新能力。但是随着时代的飞速发展,传统的教学模式已经出现了明显限制学生
除了基础工作负载的虚拟化.展望2013年的技术难题.复杂的关键业务应用缺少了高性能数据库、ERP、整合是无法运转起来的。而运行在单一硬件上的应用是不能实现以上提到的虚拟化
为了契合教育部即将颁布的《英语类专业本科教学质量国家标准》中对形成性评价的要求,本研究尝试将形成性评价体系用于英语专业翻译类课程,并在实践中逐步完善。本评价体系除常
以国信协联电厂在建的2×400 MW级燃机热电联产工程为依托,详细介绍了该工程中LZC139-13.2/1.4/555/550型汽轮机碰撞试验前需具备的条件、试验的正确方法及注意事项,明确
随着智能变电站的广泛推广使用,当面对接入间隔数目较多的情况时,集中式母线保护装置已无法满足智能变电站大容量数据交换的要求.因此开发应用于智能变电站的分布式母线装置已成