论文部分内容阅读
多Agent动态决策问题是人工智能领域研究的重点也是难点,在工业、交通和军事等领域有着广泛的应用前景。但是由于环境的不确定性、动态性和其他Agent行为的不确定性,使得求解多Agent决策问题面临巨大的状态空间和复杂的计算。交互式动态影响图(I-DID)模型凭借其高效的图形表达结构能更直观地描述决策问题,并且通过对其他Agent进行显式的建模来提高决策的质量,IDID成为解决多Agent决策问题的重要工具。 通信是Agent之间一种最基本和最重要的交互活动。Agent之间可以通过通信实现信息的共享以减少对环境和其他Agent的不确定性。但是I-DID模型不具有建模通信的能力,降低了其描述问题的能力和限制了其应用领域。本文在I-DID模型的基础上,建立了单阶段通信模型和两阶段通信模型,主要工作有: (1)介绍了交互式动态影响图及其数学模型的基本知识。 (2)建立了单阶段通信模型。在I-POMDP模型和I-DID模型的基础上,将通信动作加入Agent的动作集中,建立了单阶段通信模型的数学表达形式和图形表达形式,扩展了传统的观察函数。同时推导了其信度更新公式,并且分析了通信动作的选择与通信代价之间的关系。 (3)建立了两阶段通信模型。将每一个时间片分为通信子阶段和动作子阶段,建立了两阶段通信模型的数学表达形式和图形表达形式,同时推导了两次信度更新过程的更新公式,并且分析了通信的代价对是否选择通信动作的影响。 (4)将通信模型应用于实际的例子,并进行仿真求解。根据求解的结果,探讨了通信的代价与通信信息的价值之间的权衡问题,同时分析了通信在减少其他Agent模型个数和提高决策效率方面的作用,验证了模型的合理性和正确性。