基于深度Q学习的移动机器人路径规划

来源 :测控技术 | 被引量 : 0次 | 上传用户:toefltoefl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统Q-learning算法在复杂环境下移动机器人路径规划问题中容易产生维数灾难的问题,提出一种改进方法。该方法将深度学习融于Q-learning框架中,以网络输出代替Q值表,解决维数灾难问题。通过构建记忆回放矩阵和双层网络结构打断数据相关性,提高算法收敛性。最后,通过栅格法建立仿真环境建模,在不同复杂程度上的地图上进行仿真实验,对比实验验证了传统Q-learning难以在大状态空间下进行路径规划,深度强化学习能够复杂状态环境下进行良好的路径规划。
其他文献
在工程项目投资风险分析中,蒙特卡罗模拟是一种常用的方法,可用来解决难以用解析法求解的复杂问题,具有极大的优越性。通过算例,对实际项目的经济指标进行投资风险分析,解释
新中国成立以来,党和国家高度重视教育在青年成长成才中的作用和意义。青年是祖国的未来和民族的希望,肩负着新时代建设的重任。当代青年成长在新的时代背景和社会环境下,呈
21世纪,企业面临的竞争环境有了很大的改变,知识、信息的重要性及人力资源的独特属性使得人力资源成为新的经济环境下最重要的战略性资源。施工企业项目经理作为重要的人力资
二苯甲胺和环氧氯丙烷经亲核取代、闭环、酯化、氮解等反应制得3,3-二氨基丙烯酸1-二苯甲基-3-氮杂环丁酯乙酸盐(6)。另由间硝基苯甲醛和乙酰乙酸异丙酯在浓硫酸催化下反应制得2
借助三维全景技术,综合考虑电磁环境、施工工况等因素,对多回特高压直流线路同走廊平行走线开展研究工作,探索了基于三维全景技术辅助通道布置模拟和资源优化的工作模式,创新
《国家职业教育改革实施方案》提出要深化复合型技术技能人才培养模式,将“学历证书”与“若干职业技能等级证书”结合,提升职业教育质量,加快学校人才供给侧结构性改革。文
十八届五中全会通过的《中共中央关于制定国民经济和社会发展第十三个五年计划的建议》中,明确提出“大力发展旅游业”。旅游业更是被誉为“永远的朝阳产业”,成为我国发展最
我国的国民经济获得飞速发展,电成为人们日常生活的必需品。根据相关预测显示,截止到2020年,我国的居民用电量将呈现一个大幅度增长的去世。因此,对于电力资源的宣传也变得非
随着当今课程由"开发范式"转向"理解范式",如何建构基于"理解范式"的世界民族音乐课程是多元文化语境下音乐教育亟待思考的问题。我国引进的牛津大学出版社《世界音乐系列》
近年来社会整体经济水平的持续增长让国民公共卫生意识得到了较大程度的强化,同时社会各界在公共场所卫生方面的关注度也持续攀升,如何改善我国公共场所卫生监督监测质量已经