深度强化学习在地形自适应运动技能上的应用

来源 :科技风 | 被引量 : 0次 | 上传用户：wingoH

【摘要】

：

强化学习为开发模拟特性技能提供了一种很有效的方法,但强化学习通常需要稀疏手动的来获取特征。依赖于深度强化学习,我们引进了动作-评价和专家学习混合的学习方法(MACE)来学习动态地形自适应技能,把高纬度状态和地形描述作为该方法的输入,参数化的跳跃或行走作为输出动作。MACE方法比单一的动作-评价方法的学习效率更快,从而使动作-评价和专家学习变得更具独特性。

【作者】

：

刘仕超

【出处】

：

科技风

【发表日期】

：

2017年07期

【关键词】

：

深度强化学习地形自适应卷积神经网络

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

关于Diophantine方程x3＋1=py2

在素数p=3（8t＋4）（8t＋5）＋1和p=3（8t＋3）（8t＋4）＋1的情形下,运用初等数论的方法给出了丢番图方程x3＋1=py2无正整数解的充分条件,并得到无数个6k＋1型的素数p使得方程x3＋1=py2无正整数解.

期刊

丢番图方程正整数解奇素数同余Diophantine equation positive integer solution odd prime re

CFG桩常见施工质量问题及监控措施浅析

摘要：CFG桩基作为软土地基处理的一种施工工艺，在铁路、路基、房屋建筑基础中经常使用；CFG桩基是对原状软土地基进行加固，并与原状土形成一种复合地基基础，共同提高地基承载能，使得地基承载力能满足要求；本文就CFG桩基常见的施工质量问题及监控措施进行浅析。　　关键词：CFG桩；施工质量问题；监控措施　　CFG桩是采用长螺旋钻机，在钻进、提钻过程中一次性成型，施工速度快，与原状土形成的整体承载能力好；

期刊

CFG桩施工质量问题监控措施

关于代数多项式的一个积分表示式

研究了代数多项式导数的Bernstein不等式和Markov不等式．通过代数多项式导数的一个积分表示式，给出这两个著名不等式以及它们的离散形式的证明．

期刊

代数多项式CAUCHY积分公式BERNSTEIN不等式Markov不等式algebraic polynomials Cauchy integral f

市政工程造价控制管理遇到难题及改进

摘要：工程造价指的是工程建设过程中，预计或者在实际的技术劳务市场、设施市场、承包市场等交易活动中形成的建筑安装工程价格及建设工程价格，市场经济体制知悉啊，建筑工程属于一种独特的交易对象，在实际的交易过程中，以特定的商品形式，多次预估的基础上交易出去，最终形成的市场价格。为了保证建筑施工的经济效益，必须要加强工程造价控制及管理，但就现阶段而言，我国的市政工程造价管理过程中经常会遇到各种难题，导致造

期刊

市政工程造价控制管理存在问题改进措施

基于高校云平台和数据中心建设的研究

摘要：近些年国家对高等教育重视度不断提升，通过高校平台培养高素质人才，推动各行各业的发展与进步。随着大量人才进入社会，民众素质不断提升，对知识点需求也在快速增加，这就给高校管理工作提出新的问题。选择合适的数据系统架构模式有助于提高高校管理效率与质量，提高数据管理安全性。本文中主要探讨高校云平台与数据中心建设要点，阐述建设过程中需要注意的问题。　　关键词：高校；云平台；数据中心；建设要点　　通常来

期刊

高校云平台数据中心建设要点

深度强化学习在地形自适应运动技能上的应用

其他学术论文