基于强化学习的四足机器人运动控制研究

来源 :河南科技大学 | 被引量 : 0次 | 上传用户:hanyouzhu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前许多复杂环境中繁重的任务是工作人员不便于执行甚至无法抵达任务现场的,例如一些危险的自然灾害救援工作以及一些高辐射有毒的恶劣环境中的工程作业,这时足式机器人的优越性便凸显而出。在所有的足式机器人中,四足机器人具有结构简单,稳定性好的优点,可以稳定高效地穿越各种复杂地形到达指定的位置,还可以完成一些简单的负重运输任务。因而,研究四足机器人的运动控制具有较高的应用价值。然而,由于四足机器人内部存在弹性元件,且具有强耦合和非线性等特性,使其建模和控制成为急需解决的问题。针对这些问题,本文采用一种经验驱动的智能方法即强化学习,对四足机器人的稳定性、不规则地形行走及速度优化问题开展相关研究。本文以解决四足机器人存在的问题为目的,利用强化学习方法,具体展开如下研究:1.为了研究四足机器人的平衡能力和稳定性,提出一种基于深度强化学习的四足机器人平衡倒立摆方法。在主流的机器人仿真平台V-REP上搭建四足机器人仿真模型;分析四足机器人平衡控制问题,设计平衡控制的马尔科夫决策过程;结合四足机器人的逆运动学和深度强化学习的奖励规则,在奖励函数中添加阶梯函数,提高算法的收敛速度;用改进的确定性策略梯度算法(Deep Deterministic Policy Gradient,DDPG)与搭建的四足机器人平衡倒立摆模型交互训练,获得四足机器人平衡控制策略。仿真试验验证了所提方法在提高四足机器人平衡能力和稳定性方面的有效性。2.通过分层控制思想,将四足机器人在不规则地形(梅花桩)上的行走任务进行两级分层分解,利用强化学习分别实现落脚点选取和步态生成。将四足机器人的落脚点选取问题构建为强化学习问题,运用价值函数逼近的方法构建高级控制器完成落脚点选取任务;运用近端策略优化算法(Proximal Policy Optimization,PPO)将脚有序地移动到规划好的落脚点,同时保持四足机器人平衡。在V-REP仿真平台上搭建梅花桩地形,将该方法部署到四足机器人仿真模型上进行试验验证,仿真结果表明利用所提方法能够实现四足机器人在水平梅花桩上稳定行走。3.针对四足机器人在梅花桩上行走缓慢的问题,提出一种静步态速度优化算法,使四足机器人能够以更高的步速在一组随机分布的梅花桩上行走。站姿阶段,该算法基于稳定性约束和运动学约束,减小机器人重心的移动距离;摆腿阶段,使身体和脚在有限的关节角速度下以最高速度移动。四足机器人模型在水平梅花桩上的行走实验表明,该方法能够改善四足机器人静步态行走缓慢的问题。
其他文献
随着信息技术和先进制造技术的深入发展,生产过程的数据采集、信息交互与数据分析技术为轴承制造业向智能制造发展奠定了基础。同时随着市场需求日益多样化,智能制造成为轴承企业快速响应市场需求和实现高质量发展的必经之路。轴承智能生产线作为轴承智能制造的重要组成部分,为了更好地适应个性化需求,轴承柔性智能生产线成为主要发展趋势。然而,由于生产线设备配置缺少有效方法,无法动态适应柔性生产需求,造成生产刚性强、效
学位
随着中国先进工业的迅速发展,精密滚动轴承作为重要基本零件,在航空航天、机器人关节、精密医疗器械等方面需求量不断增加。疲劳和磨损是滚动轴承的主要损坏形式,而且大多出现在表层。滚动轴承失效会直接影响整个装备的服役性能和安全,如果发生故障,很可能会造成灾难性的事故。超声滚挤压强化工艺作为一项新兴的无切屑表面近净成形技术,能有效提高轴承套圈表层力学性能。在超声滚挤压加工过程中,合理选取工艺参数对试验结果有
学位
在工业生产快速发展的大背景下,机械臂成为了不可或缺的生产工具,对其应用环境和要求也越来越严格。其中如何实现快速规划安全避障路径,是机械臂运动控制领域的一个技术性难题。现阶段,大部分工业生产中机械臂还是通过人工示教法来实现路径规划,该方法不仅操作复杂,效率低下,而且无法保证机械臂的位姿精度,存在极大的安全隐患。常见的方法还有人工势场法、快速随机搜索树算法(RRT)、概率路线图法(PRM)等等,这些算
学位
与传统驱动器相比,压电元件优点主要体现在结构紧凑、不需要传动机构、不易受电磁干扰、空间占比小、响应速度快、推重比大、环境兼容性强等方面,常被应用在微驱动系统中。目前关于压电元件的研究,大多集中在基体材料、表面电极、控制策略、技术应用等方面。由于压电元件的驱动性能离不开结构合理的表面电极,而表面电极作为压电元件的重要组成部分,既是极化电极也是工作电极,其结构布局与制备工艺是否合理将直接影响压电元件的
学位
机床主轴轴承作为机床主轴系统的重要零部件,其运行状态直接影响机床的工作情况。主轴轴承一旦出现故障,轻则造成设备停机影响生产效率,严重的会造成设备损坏甚至影响工作人员的生命安全。本文以角接触球轴承7005C为主要研究对象,该轴承常应用于磨床和精雕机等机床的电主轴上,准确评估其运行状态,识别轴承的故障形式,及时检修可以有效预防由于主轴轴承失效造成的设备故障,保证设备安全可靠运行。本论文针对机床主轴轴承
学位
四足机器人在跟随过程中会遇到很多突发情况,为提高跟随系统的性能,需很多外部传感器对周围环境进行检测,以使跟随过程更加准确、顺利。本研究以四足机器人为研究对象,搭建了基于多模态信息融合的目标跟随系统,重点研究跟随过程中多模态信息的采集和融合处理。首先,搭建四足机器人目标跟随系统。在综合分析目标跟随系统总体设计要求的基础上,针对目标跟随系统的需求合理地选择了检测周围环境的传感器,并对传感器在四足机器人
学位
马铃薯是优质的粮食作物和经济作物,在内蒙古阴山地区,马铃薯与其他农作物相比更加适应本地气象条件,播种面积占比较大。马铃薯的块茎产量主要是受地上生物量(源)和地下块茎干物质(库)平衡的影响,区域尺度上地上生物量的估算可以为作物产量的监测与预测提供依据。本研究以阴山沿麓地区马铃薯高光谱数据为基础,确定马铃薯地上生物量和块茎干物质积累的关系,利用出版和优化光谱指数、随机森林模型和偏最小二乘法建立卓资山地
学位
大型重点装备在先进制造业中占有重要的地位,其制造技术水平高、知识技术密集,涉及多学科、多领域的交叉技术。传动系统是大型重点装备的关键部件,特大型直齿锥齿轮又是传动系统的核心零部件。特大型锥齿轮具有结构尺寸大、设备依赖度高、制齿难度大等特点,其制造能力是先进制造业核心竞争力的集中体现。因此,对特大型直齿锥齿轮的加工方法研究具有重要的意义。为了解决其体积大难以加工、加工成本高的问题,本文提出采用剖分的
学位
随着科技的发展,自动驾驶车辆、巡检机器人、工业机器人等也快速发展,环境感知已经成为机器人实现其智能化及自动驾驶技术中最关键的一部分。本文通过研究基于摄像头及激光雷达在道路、室内环境中的目标检测、识别及建图,实现机器人环境感知。本文的主要研究内容如下:1)基于YOLOv4-M模型进行视觉图像的目标检测识别研究。针对传统的目标检测算法检测精度低、时间效率慢的情况,本文研究了YOLOv4-M目标检测算法
学位
机械臂抓取物体是目前智能机器人研究的重点方向之一,比较常见的是在结构化的空间中,代替人类完成简单重复的抓取工作。随着深度学习(Deep Learning,DL)的发展,机械臂可以在非结构化空间中抓取物体,但是需要事先人为的对目标物体的特征进行标定,训练大量有关模型的数据集,抓取对象是特定的物体,缺少一定的泛化性。随着深度强化学习(Deep Reinforcement Learning,DRL)近几
学位