分层式强化学习研究进展

来源 :'2008系统仿真技术及应用学术会议 | 被引量 : 0次 | 上传用户:scutzq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
强化学习是机器学习的一个重要分支,在智能控制中有着广泛应用,具有分层结构的学习算法是克服复杂问题维数灾难、提高学习速度和适应性的关键技术之一。本文综述了分层式强化学习理论及相关算法的研究现状,提出结合定性定量推理的分层结构及各分层之间的有效信息传递与协调是提高分层式强化学习性能的关键技术,并对未来的研究进行了展望。
其他文献
随着我国修造船业的迅猛发展,国内修造船业对于修造船基础设施建设的投入也呈爆发式增长。随着建造船型的不断加大,国内造船厂的船坞建设的规模也不断扩大。大型船坞建设在工艺
会议
由于难船坐沉于长江黄金水道吴淞口宝山水道重要水域,船舶进出口非常的繁忙,使原本比较拥挤的航道变得更狭窄,严重影响了来往船只的航行通畅和安全。另外沉船内部存有一定的燃油
本文以广州市仑头-生物岛隧道工程A标段(水中段)管段预制为例,简介大型隧道工程预制管段大体积混凝土裂缝的分类、检查和处理、裂缝修补工艺。
采用半潜驳船作为移动干坞制作管段,精度控制是保证工程成败的关键。在不稳定的半潜驳上进行测量工作,必需建立符合驳船工作条件的测量控制系统。本文介绍了作者在广州仑头—生
会议
本文就台电五期循环水排水工程排水头部沉箱的浮运安装工艺进行了总结,重点详述了沉箱的助浮下水和水下定位沉放。
海上风力资源丰富,作为能源消费大国,我国正在积极推进海上风电场的建设。为确保海上风电场在建设完成后风机在全寿命周期内安全可靠高效的运行,防腐蚀保护的设计,特别是周全的防
浙江海洋T程有限公司在2005年至2006年承接了乌沙山电厂1#取水口外延工程,该工程是将1号取水口向深海延伸300m,延伸段主管为2根D3552x26x300的钢管,各通过4根D1840x16钢管与已有
大深度氦氧饱和潜水开展近半个世纪以来,出现了具有不同特点的几类饱和减压表。具有代表性的英国、法国和美国的氦氧饱和减压表均在实际潜水中得到成功应用。自从我国开展氦氧
会议
介绍了摆式列车为了解的基本原理,分析了摆式列车仿真技术现状和难点,提出了基于HLA/RTI摆式列车多学科协同仿真环境体系结构。建立了基于HLA/RTI摆式列车多学科协同仿真的团队
会议
以系统复杂性、复杂性科学与复杂系统理论为指导,采用还原论与整体论相结合的研究方法,基于复杂网络拓扑结构,多Agent理论与计算机仿真技术对信息化战争体系对抗作战行为演化的
会议