基于改进深度强化学习的三维环境路径规划

来源 :计算机应用与软件 | 被引量 : 1次 | 上传用户:nihaoyuyue2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种改进深度强化学习算法(NDQN),解决传统Q-learning算法处理复杂地形中移动机器人路径规划时面临的维数灾难。提出一种将深度学习融于Q-learning框架中,以网络输出代替Q值表的深度强化学习方法。针对深度Q网络存在严重的过估计问题,利用更正函数对深度Q网络中的评价函数进行改进。将改进深度强化学习算法与DQN算法在同样的三维环境下进行仿真实验,从最优路径长度、损失函数值、得到稳定的奖励值、收敛速度等方面进行对比,改进深度强化学习算法比DQN算法得到很大的改善,说明改进的算法比DQN算
其他文献
运用超幂技术对Pk^λ上具有一定性质超滤的个数进行研究,并且在正规无分割性质超滤个数方面得到了一些结果。
期刊
习近平总书记“七·一”重要讲话,全面回顾了我们党95年来走过的光辉历程和作出的伟大历史贡献,向全党发出了不忘初心、继续前进的伟大号召,充分展示了当代中国共产党人铭记
信息技术对于现在的教育发展有着巨大的影响,所以对于信息技术在教学中的发展需要重视起来,现在教师需要摆脱传统的应试教育束缚,网络课程辅助教学更能反映传统教育的弊端,教
提出了一种适用于针尖增强拉曼光谱(TERS)系统的金修饰钨丝探针,研究了其制备方法。有限元仿真设计了针尖的形状为内弧形针尖,并进行二氧化硅粘结层和金颗粒外层双镀膜结构纳
对任意G-分次环A,我们引进了一个与A的单位分支A_e和Smash积A#G'有关的Morita context,并讨论了它的若干应用。
3月29日,贵州省食品安全委员会全体会议在贵阳市召开,贵州省副省长何力出席会议并讲话,贵州省食安委副主任、省食安办主任、省食品药品监督管理局局长宋宇峰主持会议,来自省
通过开展“两学一做”学习教育,贵州省编委办各级党员干部思想认识有了新的提高,工作路径方法进一步明确,干事创业的精气神进一步提振,履行主体责任的高度自觉进一步增强。
三维地震属性数据巨大,在实际应用中一般采用局域克里金插值算法进行插值。目前常用的指定距离半径、指定点数、kd-tree等搜索算法均涉及距离计算、遍历已知点,相对较为费时。对此,提出一种无须距离计算、无须遍历已知点而直接利用待插值点位置的增减实现邻域点的选取方法(VAOS),以高效实现克里金插值。经过实验验证,在同精度下,该算法比距离半径搜索法快数十倍。
为了提升串联机器人绝对定位精度,提出了基于零参考模型(ZRM)的机器人几何参数标定方法。建立了包含方向矢量和连接矢量的机器人零参考模型;针对模型特点,利用改进遗传算法(I