论文部分内容阅读
追逃任务在现实生活中无处不在,它目标明确,结果可以精确度量,并且容易通过图形界面直观地显示和分析。追逃过程中每个时间点的最优决策是未知的,其效能只有在多步决策后才逐步显现出来,而且往往与对手的策略、同伴的策略和周围的环境息息相关。即使最简单的追逃任务也难以用常用的学习算法进行求解。因此追逃任务经常被用来测试多Agent行为和学习算法。追逃问题研究能为多Agent社会、先进武器系统等以MAS合作与协调技术为核心的研究提供有益探索,同时促进MAS和分布式人工智能理论的研究进展。利用理论分析与仿真实验相结合的手段对多种情形下的追逃问题进行建模、追逃算法设计和仿真实验,其主要工作如下:
⑴提出了存在静止障碍物的未知二维离散环境下的分布式追逃算法。为了让追捕Agent不断探测未知环境和逃跑Agent,在人工势能场中增加待探测区域和待捕获目标的吸引力。追捕Agent如果探测到障碍物就更新地图;若探测到逃跑Agent,就利用合同网和订购-发布协议进行任务分配。
⑵将二维离散环境下的Focused D*算法推广到三维离散空间。该算法首先根据部分已知的地图、无人机的性能约束和任务需求规划出一条初始路径,然后利用无人机在沿着初始路径飞行过程中传感器探测到的信息对路径进行实时修正,因此适合动态或部分已知的环境;随后将该算法应用于三维环境下的追逃对抗。
⑶研究了二维平面内的追逃问题。在合同网和订购-发布协议的基础上,为连续运动的追捕Agent提出了一个分布式的贪婪追逃算法以形成多个静态团队,让其分别围捕各个逃跑Agent;建立了基于资金的时间价值和违约金的动态团队算法,分析比较了各种参数条件下动态团队的性能,利用遗传算法得到了最优的动态团队参数设置。
⑷阐述了协同进化追逃的理论基础——增广拉格朗日方法,对二维平面追逃问题进行了描述,建立了动力学约束下的追逃双方运动的数学模型。由于追捕者的劣势地位,为追捕者设计了混合追捕策略,该策略能保证追逃双方策略的协同进化。在共享适应度的基础上定义了混合适应度,然后利用协同进化算法对二维平面内追捕者和逃跑者的追逃策略进行进化,比较了简单、共享和混合等适应度对进化结果的影响。进化的逃跑策略能有效规避比例制导的追捕者,逃跑者在进化过程中产生了很多复杂多变的策略。
⑸将二维平面追逃问题推广到三维空间,根据复杂动力学约束下三维空间追逃问题的数学模型,为追捕者设计了混合策略,为追逃双方的协同进化创造了条件。详细描述了JADE平台下分布式协同进化算法的设计,给出了算法流程。利用协同进化算法对三维环境下追捕者和逃跑者之间的追逃策略进行进化。进化的逃跑者能找到有效规避采取固定的比例制导策略的追捕者;追逃双方的策略在协同进化过程中表现出了一定程度的改善。