基于深度强化学习的移动机器人路径规划方法研究

来源 :天津职业技术师范大学 | 被引量 : 0次 | 上传用户:limitU
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着服务机器人、扫地机器人和自动引导车的日渐普及,路径规划作为移动机器人技术的核心成为研究的热点。在面对复杂的环境时,移动机器人需要自主学习来完成路径规划任务。随着近几年深度强化学习研究的火热及其在一些领域的优秀表现,因此考虑将深度强化学习应用到移动机器人路径规划领域。本文将通过搭载RPLIDAR A2激光雷达传感器的移动机器人,基于深度强化学习研究移动机器人的路径规划问题。首先,通过ROS和Gazebo搭建了路径规划仿真实验系统平台。具体包括:通过Gazebo编辑器搭建了一个“回”型场景,用来进行静态避障算法的训练;再用Gazebo编辑器搭建了三个封闭环境,通过向其中加入目标点和静态或动态的障碍物,用来进行趋向目标和动静态路径规划算法的训练;使用URDF设计了bobac移动机器人仿真模型,再将仿真机器人模型加入到仿真场景中,以此完成了路径规划仿真系统实验平台的搭建。其次,针对在仿真系统平台中搭建的“回”型场景,设计了基于深度强化学习的算法研究了移动机器人的静态避障。将激光雷达的测距数据作为深度强化学习算法的状态输入,经过深度强化学习方法处理后直接输出移动机器人的动作。克服了深度强化学习算法在离散动作条件下的难复现、难调参、难收敛等问题。通过仿真实验验证了设计的基于DQN算法的静态避障算法的可行性。然后,将DQN算法与迁移学习相结合研究移动机器人的路径规划问题。具体步骤为:先在没有障碍物、只有路径规划目标点的仿真场景中,基于DQN算法训练机器人具有到达任意目标点的能力;再通过放置4个静态障碍物,利用迁移学习将之前训练好的权值参数作为这一仿真场景的初始参数,训练移动机器人学习静态避障和趋向目标的能力;再通过让放置的4个障碍物作圆周运动,利用迁移学习将之前训练好的权值参数作为这一仿真场景的初始参数,训练移动机器人学习动态避障和趋向目标的能力。最后,搭建了实际的bobac移动机器人平台,分别使用SLAM方法和深度强化学习方法进行路径规划实验,实验证明,本文设计的基于深度强化学习的方法能够解决移动机器人路径规划问题。
其他文献
科学发展观是以人为本,全面、协调、可持续发展的新型社会发展观,它为大学生全面发展提供了理论指导,为大学生全面发展指明了方向,为大学生全面发展指出了路径和方法。
1.怪:指行为、语言、生活习惯等明显改变,出现一些怪异现象。一些患者由于精神因素影响,出现虚幻、怪异的听觉。2.疑:即无中生有或认为同事、邻居、亲属等对其迫害。有的病人
期刊
面对当前高校班级建设现状,深入分析社会主义核心价值体系在班级建设中的指导意义,依据学生当前思想状况及整体育人环境。按照班级建设的目标,遵照大学生的思想教育规律,最大限度
要使教育学教学摆脱困境,除了要改进教学内容外,应对教学方法进行改革。在传统的教学方法的基础上,可穿插运用"记者招待会式"的教学方法、进入角色法、问题线索法、"茶馆式"教学
电发热纺织品是利用电源控制发热元件实现温度调节的一类纺织品,具有发热速度快、耐使用性好、温度便于控制等特点,被广泛应用到服装、军事、医疗等领域。发热丝作为电发热纺