论文部分内容阅读
多机器人追捕目标问题作为多机器人系统中的一类典型合作与竞争问题,它研究的是一群追捕机器人如何通过合作去有效地捕获另一群逃跑机器人,已成为多机器人技术研究的一个热点问题,涵盖了实时视觉处理、无线通讯、实时动态路径规划、多机器人分布式协调与控制、多机器人规划与学习、机器人团队之间的竞争与合作等多学科多领域知识。 本文在国家863计划资助项目“分布式多机器人合作与竞争机制及其应用技术”的资助下,主要以机器人实现成功追捕的约束条件以及如何提高捕获逃跑者效率为目的,对多机器人竞争与合作领域的若干关键问题进行了系统深入的研究。主要包括如下几个方面: 第一,对多机器人追捕问题中多个低性能机器人追捕一个高性能逃跑者的追逃约束条件进行研究。提出在追捕机器人在性能低于逃跑者情况下,只要满足约束条件一:追逃机器人的最大速度比大于sin/nπ(n为参与追捕者的数量)和约束条件二:逃跑者的位置在追捕者位置构成的凸多边形内部,且逃跑者和追捕者构成的相邻阿波罗尼奥斯圆满足两两相交(或相切),则理论上可以实现成功追捕。然后提出基于约束条件下的一种“最优贪婪”追捕算法算法,实验结果表明本文推导出来的追捕约束条件是在追捕机器人速度低于逃跑者情况下实现成功追捕的必要条件。 第二,针对多个机器人追捕多个逃跑者问题提出一种基于快速推进法的多机器人分层分解追捕算法。由于多个参与者的加入,传统求解多机器人追捕的Hamilton-Jacobi-Bellman方程的初态变得非常复杂,并随参与者的数量增加呈指数级增加,直接求解包含有多个参与者的“鞍点”均衡解非常困难。本文首先提出多机器人分层追捕算法,该算法涉及到3个阶段,第一是代价计算阶段,计算当前系统中所有配对的包含1个追捕者和1个逃跑者的双人单一追捕代价;第二阶段是任务分配阶段,根据追捕时间最小,利用贪心算法实现追逃机器人的配对,第三阶段是任务执行阶段。在上述算法的基础上,提出基于快速推进的多机器人分层分解追捕算法,引入活跃区域机制,在任务分配阶段的时候根据主追捕机器人构造机器人追捕联盟,从而利用快速推进法实现对逃跑者的压迫。实验结果证明本文提出的算法非常有效。 第三,在有障碍物存在情况下,扩展基于运动图的方法,增加多种机器人行为,实现基于行为的多机器人追捕。针对连续状态下机器人追捕问题,提出基于强化学习和遗传算法的模糊逻辑控制学习算法(FLC-QLGA,FuzzyLogicControlalgorithmbasedonQlearningandgeneticalgorithm),首先通过强化学习获得先验经验,利用模糊逻辑实现对连续状态的覆盖,并基于遗传算法实现对模糊逻辑控制器相关参数的调整优化。实验结果表明基于该方法的追捕性能明显优越于基于行为的追捕算法和基于传统强化学习算法。 第四,搭建多机器人追捕实物平台,实现图像识别、多机器人避障及多机器人追捕的基于全自主机器人的实物实验。