复杂环境下基于深度强化学习的主动SLAM算法研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:voolxu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了使机器人能够更好的在复杂的室内环境中工作,需要机器人能够具有自主导航、避障和构建地图的能力。传统的SLAM(Simultaneous Localization and Mapping,SLAM)算法需要人为设置规划机器人的移动轨迹,增加了人工成本,导致了构建地图更复杂,而主动SLAM(Active SLAM)算法基于对周围环境的理解,机器人可以实现自主建图,而不是传统的需要人为操纵机器人构建地图,提高了机器人的能动性和自主性。本文针对以上问题,研究了移动机器人的深度图像对障碍物的识别方法、基于深度强化学习算法的避障以及将避障与FastSLAM的地图构建相结合的主动SLAM。首先,采用深度学习网络FCRN(Fully Convolutional Residual Networks)算法识别障碍物得到深度图像并构建实验环境的二维地图。搭建Turtlebot2的Gazebo仿真模型,基于Kinect对RGB图像进行FCRN深度预测,使机器人获得障碍物和环境信息。由训练和测试的损失函数可以看出,随着步数的增加,FCRN深度图像预测效果较好,并且采用FastSLAM方法构建了环境地图。其次,将避障算法融合到SLAM框架中,提出了基于深度强化学习避障的主动SLAM方法。基于FCRN算法识别障碍物训练得到的深度图像,采用Dueling DQN算法规划避障的路径,并融合到FastSLAM中完成在线避障和地图构建。实验表明,在不同数目的静态和动态障碍物的环境中,所提方法有效地完成了在地图构建过程中避开不同状态的障碍物,实现了机器人在复杂环境中的自主航行。最后,为了提高深度图像预测速度和优化机器人的行走路径,提出了基于Monodepth深度图像识别的改进的主动SLAM方法。采用Monodepth算法提高深度图像识别障碍物的预测速度,获得的双目立体影像代替了FCRN算法训练中使用的显式深度数据;采用基于概率选择的Dueling DQN深度强化学习优化行走路径,最后与FastSLAM融合完成了不同数目下的静态、动态障碍物环境下的自主航行并构建了环境地图。
其他文献
由于轨道电路的性能受环境因素的影响较大,其故障的发生具有较大的随机性和模糊性,而单一诊断方法因考虑角度的片面性以及知识库的不完善性,往往很难满足轨道电路故障诊断的实际
前段时间,在进行全县初中教学工作视导调研时,一种现象引起了我的思考:随着城市化进程的加快,部分农村初中生源锐减,在这一背景下,学校是以教研组为实体办公好,还是以年级组为实体办
报纸
节约型酒店建设是构建节约型社会的一个组成部分,是在绿色酒店的基础上进一步突出“节约”.强调在规范管理与优质服务中提高资源有效利用率。酒店业在一次性用品的使用和水电使
西方语言学者把符号的结构拆解之后努力使结构外部的因素与原来结构内部的因素相结合,从而促进多元的构建。这也是源语言的符号意义得到了再现和“重构”,让其文本内部因素与原
肾性贫血是慢性肾脏病(chronic kidney disease,CKD)的常见临床表现和重要合并症,也是CKD患者合并心血管并发症的独立危险因素。其病因主要与肾脏合成红细胞生成素(erythropo
苏北人民医院将入院服务中心、检查服务中心、围手术期管理中心、加速康复团队、日间手术管理中心、医联体联合病房等医疗服务供应链上相关平台进行升级并整合,在各平台间实
<正>据报道,脑性瘫痪患儿中70%-80%伴有语言障碍,严重影响患儿的交流、交往和社会心理发育。因此,语言训练在脑瘫患儿综合治疗中显得非常重要。国内采用传统医学加手法矫治、功
应激性心肌病指那些非冠状动脉狭窄或堵塞,因强烈刺激使机体释放大量儿茶酚胺所造成的心肌损伤,甚至导致致死性心律紊乱而突然死亡的病例。本文对有关机理作一综述。
以STM32F107RB微控制器为控制核心,采用无源支柱式方案,设计了电子式电流互感器数据采集系统,该系统将信号通过电缆传至低压侧,以提高电子电路部分可靠性;根据多通道数据采集