深度强化学习在地形自适应运动技能上的应用

来源 :科技风 | 被引量 : 0次 | 上传用户:wingoH
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
强化学习为开发模拟特性技能提供了一种很有效的方法,但强化学习通常需要稀疏手动的来获取特征。依赖于深度强化学习,我们引进了动作-评价和专家学习混合的学习方法(MACE)来学习动态地形自适应技能,把高纬度状态和地形描述作为该方法的输入,参数化的跳跃或行走作为输出动作。MACE方法比单一的动作-评价方法的学习效率更快,从而使动作-评价和专家学习变得更具独特性。
其他文献
在素数p=3(8t+4)(8t+5)+1和p=3(8t+3)(8t+4)+1的情形下,运用初等数论的方法给出了丢番图方程x3+1=py2无正整数解的充分条件,并得到无数个6k+1型的素数p使得方程x3+1=py2无正整数解.
摘要:CFG桩基作为软土地基处理的一种施工工艺,在铁路、路基、房屋建筑基础中经常使用;CFG桩基是对原状软土地基进行加固,并与原状土形成一种复合地基基础,共同提高地基承载能,使得地基承载力能满足要求;本文就CFG桩基常见的施工质量问题及监控措施进行浅析。  关键词:CFG桩;施工质量问题;监控措施  CFG桩是采用长螺旋钻机,在钻进、提钻过程中一次性成型,施工速度快,与原状土形成的整体承载能力好;
研究了代数多项式导数的Bernstein不等式和Markov不等式.通过代数多项式导数的一个积分表示式,给出这两个著名不等式以及它们的离散形式的证明.
摘 要:工程造价指的是工程建设过程中,预计或者在实际的技术劳务市场、设施市场、承包市场等交易活动中形成的建筑安装工程价格及建设工程价格,市场经济体制知悉啊,建筑工程属于一种独特的交易对象,在实际的交易过程中,以特定的商品形式,多次预估的基础上交易出去,最终形成的市场价格。为了保证建筑施工的经济效益,必须要加强工程造价控制及管理,但就现阶段而言,我国的市政工程造价管理过程中经常会遇到各种难题,导致造
摘 要:近些年国家对高等教育重视度不断提升,通过高校平台培养高素质人才,推动各行各业的发展与进步。随着大量人才进入社会,民众素质不断提升,对知识点需求也在快速增加,这就给高校管理工作提出新的问题。选择合适的数据系统架构模式有助于提高高校管理效率与质量,提高数据管理安全性。本文中主要探讨高校云平台与数据中心建设要点,阐述建设过程中需要注意的问题。  关键词:高校;云平台;数据中心;建设要点  通常来