基于改进的DQN机器人路径规划

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:candy136892
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对深度Q学习算法在机器人路径规划中的过估计问题,提出一种动态融合深度双Q算法(dynamic target double deep Q network,DTDDQN)。通过动态融合DDQN和平均DQN的先验知识进行网络参数训练,前期以较大权重的DDQN优化目标对估计网络进行网络训练和先验知识的积累,随着学习的深入,增大平均DQN的优化目标对网络训练的权重,使网络输出的Q值更加接近真实Q值,减少过估计对机器人在选择动作时的影响,达到所选策略最优。仿真对比结果表明,DTDDQN算法在路径规划中能更好解决过估
其他文献
为提高基于接收信号强度指示(RSSI)室内定位的定位精度,并降低时效性对定位的影响,提出将加权仿射传播聚类(WAP)与广义径向基函数(RBF)神经网络相结合的室内定位算法以及一种
针对目前跨模态哈希方法中存在的哈希码鲁棒性不足、量化误差较大的问题,提出一种重构约束的离散矩阵因式分解哈希算法。通过矩阵因式分解直接学习多模态数据的离散深层潜在
传统推荐系统以评分作为推荐依据,没有分析与利用用户的评论内容,导致推荐系统存在推荐准确性低和数据稀疏性的问题。针对这种情况,结合降噪自编码器和卷积神经网络提出一种
2020年12月29日,《中国红木产业发展现状调查》项目启动会在北京召开。来自国家林业和草原局野生动植物保护司、中国林业产业联合会、中国林产工业协会、中国林科院木材工业
根据俄罗斯联邦统计局数据,2020年俄罗斯锯材和板材产品产量下降。联邦统计局指出,在2020年1—11月,国内林业企业锯材和板材产品总产量为2640万m3,与去年相比下降4.3%;木窗、
2021年1月8日,我国首条自动化胶合板生产线——广西森工集团胶合板自动化生产线在百色市竣工投产。该项目为广西壮族自治区层面统筹推进重大项目,引进了陆特(Raute)、山西秋
2021年1月21日,Industry News报道加拿大木材及胶合板巨头Weston Forest被美国Watermill Group收购。Weston Forest目前是工业及建筑行业两个领域重要的原料供应商,主要市场
为提高支持向量数据描述的训练精度,提出一种闭合超球面机。在训练阶段利用目标类样本构造最小包围超球,利用非目标类样本调整描述边界;在测试阶段计算待测样本与最小包围超
利用蒸馏分离—气相色谱法技术,建立了同时测定煤焦油中苊、氧芴和芴的分析方法。通过对色谱条件的优化,以甲苯为溶剂,正十二烷为内标物,将煤焦油馏分采用DB-5毛细管柱,对煤
利用流程模拟软件Aspen Hysys对辽阳石化公司130×104 t/a加氢裂化掺炼不同量常3线直馏柴油混合原料性质进行模拟,通过对掺炼量为30 t/h实际参数和模拟值对比,得到精制反