【摘 要】
:
针对双足机器人在非平整地面行走时容易失去运动稳定性的问题,提出一种基于一种基于价值的深度强化学习算法DQN(Deep Q-Network)的步态控制方法。首先通过机器人步态规划得到
【机 构】
:
北京理工大学机械与车辆学院,北京理工大学机电学院
【基金项目】
:
国家部委重点预研基金资助项目(3020020221111)~~
论文部分内容阅读
针对双足机器人在非平整地面行走时容易失去运动稳定性的问题,提出一种基于一种基于价值的深度强化学习算法DQN(Deep Q-Network)的步态控制方法。首先通过机器人步态规划得到针对平整地面环境的离线步态,然后将双足机器人视为一个智能体,建立机器人环境空间、状态空间、动作空间及奖惩机制,该过程与传统控制方法相比无需复杂的动力学建模过程,最后经过多回合训练使双足机器人学会在不平整地面进行姿态调整,保证行走稳定性。在V-Rep仿真环境中进行了算法验证,双足机器人在非平整地面行走过程中,通过DQN步态调整学习
其他文献
近代进化论思潮是在科学旗帜下形成的思想运动,这一思潮在当时的老庄学中也有鲜明的映射。无论是援引社会进化学说解《老》,抑或用生物进化论释《庄》,还是比较"天择"与"天钧"之
目的:针对钛种植体植入后组织感染问题,在纯钛阳极氧化-植酸处理工艺基础上,引入具有抗菌性的铜元素,探究不同镀铜含量涂层的细胞相容性以及对抗菌性能的影响。方法:纯钛表面两
GPS RTK技术主要应用在测绘工程中,提高了测绘工程的检测结果准确率.本文从测绘工程GPS RTK技术概念的角度出发,对GPS RTK技术的特点进行了浅析,从而确定了GPS RTK技术的工作
通过行列式的形式构造辅助函数,用来求解与微分中值定理有关的一类存在性问题.
主要讨论植物是如何对盐渍环境适应的,盐渍环境对植物产生两种胁迫因子--渗透胁迫和离子胁迫,前者有水困难,后者对植物代谢生理功能产生毒害。植物要适应盐渍环境必须具备克服这两
随着人口老龄化进程的加快及机器人、智能控制等方面技术的不断发展,关于助老助残服务机器人的研制开发也越来越多的受到人们的关注。文章在近年来服务机器人定位技术研究和发
家支是凉山彝族社会中长期存在的一种典型的血缘维系的自主组织,在其发展过程中积累了具有凉山彝族特色的社会组织与管理经验。从以多元主体为核心的当代治理变革背景来看,家
合作学习既是一种成熟的教学理论,也是一种有效的学习策略。探讨了应用合作学习策略帮助学生提高英语口语学习效果的途径和方法,以及学习中应注意的问题。
深基坑由于地质状况多样性,施工中也有很多形式的方法。湟水河大桥属于深基坑,地质为较厚卵石层。该文介绍了青海某大桥在基础施工过程中,应用了桩排式地下连续墙围堰,与主桥
系统可靠度的计算一直存在瓶颈,就是如何找出复杂系统的失效模式,并在考虑元器件间、各失效模式间的相关性下计算系统的可靠度。文章提出了能充分考虑相关性的基于copula函数