论文部分内容阅读
动态不确定环境下的多主体决策是人工智能研究中的一个关键问题,该决策问题可以归结为高层的意图生成和"意图冲突"调解问题以及底层的行动选择问题.该论文分析了当前动态不确定环境下多主体推理决策和意图冲突研究的现状,指出了当前研究的缺陷,为了适应动态不确定环境所包含的行动的不确定性,观察的不确定性以及环境的不可预测性,给出了一种新的多主体决策推理模型(MTICP),并在此模型上进一步给出了模型的决策推理算法,意图冲突描述机制,意图生成机制以及意图冲突调解机制,并且与相关工作进行了比较,分析说明了模型的合理性.MICIP模型的主要特点是将POMDP理论、规划方法和BDI理论相结合,这样做的好处是:1)系统依然保存了传统规划理论的一些特点,比如means-end推理等;2)增加了POMDP中的量化分析手段,便于系统地分析合作和冲突问题;3)更加方便准确的描述环境的动态不确定性,符合实际问题的需要.因为模型结合了POMDP和PRS的一些优点,POMDP可以更好的描述环境的动态不确定性,而PRS中计划的引入以及类似于PRS的规划和子规划的持续选择和展开保证了推理的及时性,也能够更加适应环境的动态不确定性.4)模型中引入了通讯的概念,并对通讯和观察作了详细的讨论,分析了不同条件下模型的复杂度问题.最后,论文讨论了模型的系统实现框架,给出了具体的决策推理算法.由于四足机器狗比赛环境是一个研究动态不确定环境下多主体的行动选择以及意图冲突的典型平台,作者又在该典型环境下设计了一个两个机器狗的关于局部进攻和防守合作的典型问题,使用MTICP模型抽象该问题并且进行了试验分析,进一步和以往使用的传统的有限状态机结合决策论的方法进行了比较,说明了模型的合理性.