基于改进深度强化学习的三维环境路径规划

来源 :计算机应用与软件 | 被引量 : 1次 | 上传用户：nihaoyuyue2009

【摘要】

：

提出一种改进深度强化学习算法(NDQN),解决传统Q-learning算法处理复杂地形中移动机器人路径规划时面临的维数灾难。提出一种将深度学习融于Q-learning框架中,以网络输出代替Q值表的深度强化学习方法。针对深度Q网络存在严重的过估计问题,利用更正函数对深度Q网络中的评价函数进行改进。将改进深度强化学习算法与DQN算法在同样的三维环境下进行仿真实验,从最优路径长度、损失函数值、得到稳定的

【作者】

：

封硕舒红谢步庆

【机构】

：

长安大学工程机械学院,长安大学理学院

【出处】

：

计算机应用与软件

【发表日期】

：

2021年01期

【关键词】

：

深度Q网络强化学习过估计问题三维环境的路径规划 Depth Q network Reinforcement learning Overestimation

【基金项目】

：

陕西省自然科学基金项目(2018JQ5059),陕西省科技计划项目自然科学基础研究计划一般项目(211425180248)

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

P_κλ上正规无分割性质超滤的个数

运用超幂技术对Pk^λ上具有一定性质超滤的个数进行研究，并且在正规无分割性质超滤个数方面得到了一些结果。

期刊

正规超滤分割性质超幂Normal ultrafilter Partition property Ultrapower

《西北工业大学学报(社会科学版)》2020年总目录

期刊

不忘初心砥砺前行努力在新的历史性“赶考”中交出更加优异的答卷

习近平总书记“七·一”重要讲话，全面回顾了我们党95年来走过的光辉历程和作出的伟大历史贡献，向全党发出了不忘初心、继续前进的伟大号召，充分展示了当代中国共产党人铭记

期刊

历史性答卷中国共产党人历史贡献光辉历程责任担当政治自觉以人为本

试述网络课程辅助高中地理学习的有效性

信息技术对于现在的教育发展有着巨大的影响,所以对于信息技术在教学中的发展需要重视起来,现在教师需要摆脱传统的应试教育束缚,网络课程辅助教学更能反映传统教育的弊端,教

期刊

网络课程高中地理辅助教学

适用于TERS系统的金修饰钨丝探针制备和研究

提出了一种适用于针尖增强拉曼光谱(TERS)系统的金修饰钨丝探针,研究了其制备方法。有限元仿真设计了针尖的形状为内弧形针尖,并进行二氧化硅粘结层和金颗粒外层双镀膜结构纳

期刊

计量学钨探针针尖增强拉曼光谱纳米颗粒修饰metrologytungsten probe tipTERSnanoparticle modificat

一个与分次环的Smash积有关的Morita context

对任意G-分次环A,我们引进了一个与A的单位分支A_e和Smash积A#G'有关的Morita context,并讨论了它的若干应用。

期刊

分次环MORITASMASH积CONTEXTGraded ring Smash product Morita context

构建严密高效的食品安全管理体系

3月29日,贵州省食品安全委员会全体会议在贵阳市召开,贵州省副省长何力出席会议并讲话,贵州省食安委副主任、省食安办主任、省食品药品监督管理局局长宋宇峰主持会议,来自省

期刊

药品监督副主任当代贵州监管队伍监管链条生产许可监管体制改革以评促管舆情信息问题导向

“六强化六推动”提升为民服务效率

通过开展“两学一做”学习教育，贵州省编委办各级党员干部思想认识有了新的提高，工作路径方法进一步明确，干事创业的精气神进一步提振，履行主体责任的高度自觉进一步增强。

期刊

服务效率学习教育思想认识党员干部主体责任贵州省精气神

VAOS克里金插值在三维地震属性平面图的应用

三维地震属性数据巨大,在实际应用中一般采用局域克里金插值算法进行插值。目前常用的指定距离半径、指定点数、kd-tree等搜索算法均涉及距离计算、遍历已知点,相对较为费时。对此,提出一种无须距离计算、无须遍历已知点而直接利用待插值点位置的增减实现邻域点的选取方法(VAOS),以高效实现克里金插值。经过实验验证,在同精度下,该算法比距离半径搜索法快数十倍。

期刊

三维地震属性平面图克里金算法距离半径搜索算法待插值点位置的增减算法3D seismic attributeKriging algorithm for

基于几何参数标定的串联机器人精度提升

为了提升串联机器人绝对定位精度,提出了基于零参考模型(ZRM)的机器人几何参数标定方法。建立了包含方向矢量和连接矢量的机器人零参考模型;针对模型特点,利用改进遗传算法(I

期刊

计量学串联机器人几何参数标定零参考模型改进遗传算法定位精度metrologyserial robotgeometric parameters c

基于改进深度强化学习的三维环境路径规划

与本文相关的学术论文