基于深度强化学习的准被动双足机器人步态控制策略研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:crazyinlove_2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
同其他类型的地面移动机器人相比,双足机器人具有更好的运动能力,是服务机器人理想的载体,也是最容易融入人们日常生活的机器人类型。准被动双足机器人因低能耗、步态柔顺、拟人等优点,成为双足机器人研究中的热点。然而,由于准被动双足机器人非线性、强耦合、多变量的动力学系统,使其存在行走步态单一、行走稳定性弱、步态控制困难等问题,导致其目前难以实现广泛的应用。行走稳定性作为衡量准被动双足机器人行走运动性能的重要指标,是实现广泛应用的关键。因此,如何控制准被动双足机器人的行走运动,提升准被动双足机器人的行走稳定性成为亟需解决的关键问题。深度强化学习方法作为目前新兴的人工智能技术,拥有强大的感知能力与决策控制能力,对准被动双足机器人的步态控制具有重要研究价值。在本文中,针对准被动双足机器人行走稳定性差、步态控制困难等缺陷,提出基于深度强化学习的准被动双足机器人步态控制方法,本文的主要研究工作如下:首先,通过直腿前向足机器人行走过程的分析,建立前向足机器人混杂动力学模型。在此基础上,引入庞加莱映射法分析机器人的行走稳定性,利用牛顿-拉夫森迭代法获得前向足机器人的不动点,进而分析机器人内外参数对机器人行走稳定性的影响,为后文步态控制方法的研究奠定基础。其次,以提升机器人行走稳定性为目标,结合机器人行走运动特点,建立智能体状态、智能体动作、奖励函数。并基于学习效率与最终学习效果,分别提出基于深度确定性策略梯度算法的机器人步态控制方法与基于近端策略优化算法的机器人步态控制方法,实现固定斜坡场景下机器人行走运动的有效控制。再次,为提升机器人不同斜坡路面的稳定行走能力,增强深度确定性策略梯度算法的学习能力。在深度确定性策略梯度算法的基础上,重新设计算法结构、智能体状态、奖励函数与交互回合过程,提出基于Ape-X DPG的机器人步态控制方法,实现对机器人在不同斜坡路面上稳定行走运动的控制,并通过行走稳定性分析验证Ape-X DPG对机器人行走运动的控制能力。最后,将机器人模型参数作为智能体状态的一部分,赋予深度强化学习对不同机器人模型的自主辨识能力,提出基于深度强化学习的通用步态控制方法,实现对不同机器人在不同斜坡路面上行走运动的控制。在仿真实验中,通过结合双足机器人模型参数的近端策略优化方法,在不同坡度的斜坡上实现对直腿圆弧足机器人、直腿前向足机器人、有膝点足机器人三种不同结构、参数的机器人步态的高效稳定控制,验证了所提方法的有效性。
其他文献
随着城市轨道交通事业的快速发展,网络化运营已成基本趋势。网络化运营条件下,换乘站的数量逐渐增多,不同线路之间的换乘行为也更加普遍。在时刻表优化时充分考虑乘客的换乘行为,不仅可以提高换乘满意度,也可以提升路网运输效率。本文从乘客换乘的角度出发,综合考虑换乘乘客走行速度的差异性和换乘乘客对站台等待时间的差异性感知,研究换乘站的时刻表协调优化问题,对提高换乘便捷性和车站服务水平有重要的作用。相关研究内容
人工智能在航天、医疗、交通等领域的广泛应用,使得生活因科技而更美好。但我们必须警醒:人工智能并不是绝对安全的,其高度复杂性和自主性是有利的,也是有弊的。人工智能做出的自主决策极有可能不符合人的理性思维,与以帮助人为目的之设计初衷背道而驰,出现失控并致人损害的后果。如何界定人工智能法律属性,确定侵权主体,界定侵权行为及适用归责成为关注点。中医人工智能标准化缺失影响侵权行为的认定,同时,医疗信息的隐私
剪力墙是高层和超高层建筑中常用的抗侧力结构构件,但传统剪力墙自重大易开裂,制约了其在建筑结构中的应用,为了进一步改善剪力墙的抗震性能,组合剪力墙通过不同材料的组合,
在初中阶段,英语学科是学科体系中的一门重要组成学科,在我国的各级各类学校当中都有开展英语教育教学.在党的十八大的胜利召开之后,渗透传统文化,弘扬中华优良传统成为当前
据“Modern Plastics,2006,83(6):127”报道,Gharda化学品公司展示了一种以砜为基础的具有刚性链段的新型聚醚砜,该树脂玻璃化温度为265~270℃,连续使用温度可达220~230℃。这种牌号为G
机器人融入人类的正常生活,可以使人们更加独立。人们在日常生活中总会发生一些意外,比如摔倒等,因此及时且专业地包扎伤口是非常重要的。然而,目前机械臂应用于包扎护理任务
本文运用有限元分析软件ANSYS对采用消能减震新技术的潮汕星河大厦进行了模态分析、瞬态动力有限元分析.该工程的消能部件采用复合型铅粘弹性阻尼器.在确定了复合型铅粘弹性
“面子”与“里子”王家卫导演的电影《一代宗师》里有句台词说:“人这辈子,有的人活成了面子,有的人成了里子,能耐是其次的。”套用这个说法,在学术圈里,人们往往只盯着光鲜亮丽的
利用辐射引发的界面反应来改善聚丙烯/低密度聚乙烯(PP/LDPE)共混体系的力学性能。研究了多官能团单体三聚异氰酸三烯丙酯(TAIC)、三羟甲基丙烷三甲基丙烯酸酯(TMPTMA)对PP/LDPE共混体
我曾在美国西北大学的法学院度过了自己攻读法学博士的第一年生涯,那一年的生活可以用“暗无天日”四个字来形容。第一年课程结束后,我从芝加哥转战到纽约,先是于2011年暑假在纽