基于增强学习的多机协同路径规划的研究与应用

来源 :上海大学 | 被引量 : 0次 | 上传用户:poiuytrewq10
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器人技术的发展使机器人的能力不断提高,机器人应用领域和范围不断扩大。路径规划作为移动机器人技术的一个重要组成部分,对它的研究具有重要的理论意义和工程应用意义,而多机器人协同工作下的路径规划更是一个研究热点。 增强学习是近几十年来迅速发展起来的一类机器学习方法。增强学习不需要有先验知识,而是通过与环境的不断交互获得知识,改进行为策略,具有自学习能力。增强学习由于自身的特点,在自主机器人研究领域中受到了国内外越来越多的重视。本文将致力于基于增强学习算法的多移动机器人协同路径规划的研究。 基于马尔可夫过程的增强学习能够很好地应用于单智能体环境中,而由于增强学习的特点,在多智能体系统中马尔可夫过程模型不再适用,因此不能把增强学习直接用于多智能体的协作学习问题。 为此本文首先提出了基于增强学习的分布式控制的多智能体协作方法。该方法主要通过在每个智能体中构筑两层增强学习单元来实现,第一层增强学习单元负责学习智能体的联合任务协作策略,第二层学习单元负责学习智能体内最有效的行为策略。 另外,本文还提出了基于智能体运动特征的增强学习奖赏函数。 在静态、动态环境下的多智能体协同搬运实验表明本文提出的方法能有效地完成搬运任务。此外,在动态环境下的多智能体协同搬运实验表明基于智能体运动特征的奖赏函数使智能体更早发现较优路径并很好地完成了协作任务。
其他文献
集成电路中的所有器件都是通过电源网格得到其所需的供电电压的。随着集成电路制造工艺的不断向前推进,尺寸的不断缩小,电源网格完整性分析也变得越来越重要了,互连线的电阻
随着Internet的飞速发展,它成为了迄今为止最密集、最丰富的信息来源。那么从这些海量数据中找到使用者感兴趣的信息逐渐成为人们关注的焦点。作为从 Web 文档和 Web 活动中