基于强化学习的仿人机器人步行稳定控制方法

来源 :大连理工大学 | 被引量 : 1次 | 上传用户:qlj403740087
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
优良的步行控制策略能够帮助仿人机器人适应多样化的工作场景,而步行过程中的稳定性控制更是步态规划研究的难点和重点问题。本文针对仿人机器人的步行稳定性问题,设计了基于强化学习的自适应在线稳定性控制策略,实现了仿人机器人步行过程中的实时稳定性控制,并开发了机器人联合仿真系统进行实验验证。主要工作如下:(1)针对仿人机器人在非水平环境中行走时容易受路面影响而导致步行不稳定的问题,提出了一种结合离线步态规划与在线关节角度补偿的双足行走控制方法。该方法基于Actor Critic(AC)强化学习算法建立仿人机器人的自适应控制模型,以BP神经网络拟合控制策略,通过接收连续状态信息,实现了输入信号到输出关节角度补偿值的端到端控制,并使用三次样条插值法实现了动作之间的平滑过渡。此外,设计了连续立即回报函数,提高了学习过程的收敛速度。(2)针对仿人机器人的仿生特性和小脑在步行中的平衡控制作用,本文基于强化学习理论建立了仿小脑的控制模型。该小脑模型的建模以小脑的解剖学结构和神经电信号在小脑中的传递过程为基础,以模块化的设计方式将小脑模型分为状态编码模块、小脑功能模块、运动映射模块以及下橄榄反馈模块四个部分。结合时间差分(TD)强化学习算法获得环境反馈的评价性信息来调整行为策略和相关突触的权值,使小脑模型具备了学习能力。最后,基于TD强化学习小脑模型建立了在线稳定控制器,其能够在离线步态规划的基础上,自适应地对仿人机器人的下肢关节进行调整,提高步行稳定性。(3)为了提高研究效率,使开发过程更加方便快捷,搭建了跨平台、跨语言的机器人联合仿真系统。通过相关的库函数和应用程序接口,实现了C++程序对Python脚本的调用以及双向信息传递,并且使用MATLAB Engine实现了MATLAB与Webots的实时通信。研究与开发实践表明该仿真系统可以同时利用Python、MATLAB和C++语言的优点进行机器人控制程序的开发,为后续控制算法的研发与验证提供了平台。(4)在机器人联合仿真系统中对本文提出的AC强化学习仿人机器人控制方法与TD强化学习小脑模型控制方法进行了仿真实验,以坡度变化的斜坡作为实验环境进行测试,结果表明,两种控制方法都能实时调整机器人的姿态,增强其在行走中的稳定性。本文深入研究了仿人机器人步态规划、强化学习、小脑模型,开发了仿人机器人的稳定步行控制策略,并基于此策略构建了步行控制系统,对强化学习和小脑模型的应用以及仿人机器人控制策略的发展起到了促进作用。
其他文献
人脸吸引力是近年来认知心理学、社会心理学、美容学、计算机科学等领域的热门话题,它对人们的社会生活有着重要影响。尽管关于人脸吸引力的研究已有许多方法,但是学者们主要
随着通信技术的日益成熟,现代社会对数据安全的重视程度也日益加深,在现代网络空间中传输的数据,出于对传输信息保密性的需要,在大量的应用场景当中,都依赖于数据加密。用于加密的数据通常是随机的、不可预测的信息。正因如此,数据加密的安全性,很大程度上,依赖于其加密序列的随机性与不可预测性,有效测量一个随机序列的随机性,具有重要的价值。随着近年来量子计算领域的蓬勃发展,传统人工算法生成的随机数地位逐渐受到量
数字化时代,在组播通信运用于多个领域的同时,组播通信的安全性也带来了许多技术挑战。数据加密传输是保证组播通信内容的机密性的有效途径,组播密钥分发作为组播数据加密传输中的重要一环,成为当前研究热点。在此研究背景下,如何构造一套完善的组播密钥分发协议是一个有趣的课题。组播密钥是加密组播通信内容的密钥。在成员不断加入和退出的通信组中,只有实现了组播密钥的安全地分发及更新,才能避免通信内容的泄露。本文主要
随着现代社会飞速发展,人们在物质日益得到满足的同时,生活节奏也变得更快,人们面临更大的生活压力,从而导致睡眠问题更加普遍。人们希望居家环境下可以监测自己的睡眠状况,
近年来,物理层安全技术引起相关学者的注意,而着眼信息隐藏的射频水印受到最多关注。信息隐蔽技术一直是一个热门的研究课题,而且数字水印已经成为信息隐藏的重要组成部分。本文则将研究的对象转移到射频信号上,主要研究射频信号中的隐蔽信息传输技术,我们称之为物理层水印或者射频水印。脏纸信道是受到两个加性噪声干扰的信道,其中一个加性噪声为发送端已知,另一个对于发送端与接收端均是未知的。称发送端已知的加性噪声为载
随着互联网、云计算的发展,传统的网络架构已经无法满足企业用户对于网络灵活性的需求。软件定义网络(SDN)作为一种新型的网络架构得到了广泛的关注。软件定义网络将传统网络的数据平面以及控制平面分离,实现了两个平面的独立演进,提高了网络的可编程性。软件定义网络往往采用逻辑上集中式的控制平面,通过控制网络与数据平面(交换机)相连。数据平面专注于数据的快速转发,控制平面按照业务逻辑,通过控制协议来向数据平面
精准的水下目标识别能力是水下机器人高效作业的保证。但是,在复杂多变的水下环境,设备采集到的图像普遍存在光照不均、对比度低、蓝绿色调、画面模糊等一系列问题。此外,受
计量学是研究物理参量的高精度测量方法的学科,而任何基于经典物理的计量精度都受限于散粒噪声极限,如何突破该极限是现代精密科学技术发展的迫切需求。量子计量学是研究如何
法定继承作为继承的重要方式,对于被继承人财产的分配起到了至关重要的指导作用。我国2021年1月1日正式生效实施的《中华人民共和国民法典》(以下简称“《民法典》”)规定的法定继承人范围包括两个顺位六类主体,并以代位继承制度保障被继承人晚辈血亲的继承权益。该范围除增设被继承人兄弟姐妹的子女可以代位继承外,延用了1985年《中华人民共和国继承法》(以下简称“《继承法》”)所规定的法定继承人范围。三十多年
学位
目的研究通过探讨正电子发射断层扫描(PET)测定帕金森病(PD)患者脑内葡萄糖代谢的应用价值。应用PET技术监测脑葡萄糖代谢,为帕金森病的诊断及病程监测提供有效手段。PET技术还可