移动机器人路径规划强化学习的初始化

来源 :控制理论与应用 | 被引量 : 33次 | 上传用户:dqwq1314
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对现有机器人路径规划强化学习算法收敛速度慢的问题,提出了一种基于人工势能场的移动机器人强化学习初始化方法.将机器人工作环境虚拟化为一个人工势能场,利用先验知识确定场中每点的势能值,它代表最优策略可获得的最大累积回报.例如障碍物区域势能值为零,目标点的势能值为全局最大.然后定义Q初始值为当前点的立即回报加上后继点的最大折算累积回报.改进算法通过Q值初始化,使得学习过程收敛速度更快,收敛过程更稳定.最后利用机器人在栅格地图中的路径对所提出的改进算法进行验证,结果表明该方法提高了初始阶段的学习效率,改善
其他文献
为了减轻用户疲劳并增强算法的搜索性能,本文在变种群规模交互式遗传算法的基础上引入协同训练半监督学习方法,提出基于半监督学习的变种群规模区间适应值交互式遗传算法.根
针对加速度受约束的非线性时变系统,设计了一种全局最优滑模控制算法.首先引入全程滑态因子,保证滑模面一开始就在零值附近,然后选取位置跟踪误差绝对值的积分为指标函数,通
云南以其美丽、富饶、神奇而著称于世,一向被外界称为“谧界”。古语云:一日长一丈,云南在天上。它确实离天很近。三百万年前,一次强烈的地壳运动使地处海洋深处的谷地突兀而起,造
将遗传算法的编码方式与智能体系统的演化结构相结合,提出一种求解多阶段多产品调度问题的链式智能体遗传算法.算法采用基于订单序列的编码方式,采用一种新的后向指派规则实
主要探讨了低聚木糖对蛋糕的品质、保质期、蛋糊的稳定性及主要配料用量的影响,为工业化生产提供依据.
本研究用枸杞和鲜牛乳为主要原料,辅以蔗糖、稳定剂等辅料,制成的酸奶既可提高营养与保健价值,又能改善酸奶的风味和口感.
在制度供给中占据主导地位的政府,对慈善组织的管理存在着社会资源获得和社会控制需求之间的矛盾。这种冲突性制度环境导致慈善组织的合法性和活动效率之间产生矛盾,只有准行政
针对船舶航向运动具有强非线性,并受各种不确定随机干扰的作用,提出了基于最小二乘支持向量机与变论域模糊逻辑的船舶航向保持复合控制方案,该控制方案利用最小二乘支持向量
针对基于智能材料驱动器串联驱动的微纳定位系统,本文主要探讨了此类高精定位系统的控制设计策略.其控制设计的主要任务是消除驱动器中未知回滞特性对系统性能所造成的负面影