论文部分内容阅读
早期智能规划研究一直集中在“封闭世界”假设之下的经典规划领域,然而,很多实际问题并不满足这样的假设条件,因此,一些学者将目光投向了不确定性规划的研究,其中概率规划的研究取得了一定的成绩,由于人工智能研究中的不确定性通常是顺序的、定性的,动作效果的概率在实际中往往很难获得,一些研究认为,可能性理论更适合解决那些概率模型无法解决或者概率信息很难获得的问题,提出可能性规划的概念,在可能性规划中,规划的初始世界状态是部分已知的,规划动作的效果按照对最终目标的完成效用被分成各个等级。然而,求解可能性规划的可能性价值迭代算法往往只能高效地求解较小的问题,尤其,伴随着域特征数目的增加状态空间的规模往往呈指数级增长,会陷入Bellman的维度灾难。同时,智能规划的求解方法由最初的用归结定理证明的方法求解规划,扩展为用STRIPS方法求解规划问题,及将规划问题转化为可满足问题来求解和采用模型检测的方法来求解规划问题。其中利用模型检测的方法求解规划取得了很好的成绩,在2000年规划大赛上,基于模型检测的MIPS(The Model Checking Integrated Planning System)规划系统,采用二元决策图(Binary Decision Diagrams)来压缩地表示规划状态,使得规划解的搜索空间得到有效的扩展。本文基于可能性理论和决策图理论提出一种新的决策图:可能性决策图,用于对不确定环境下的不精确的和模糊的信息进行编码,并用定理证明所提出的可能性决策图能规范地表示可能性命题公式,而且定义了可能性决策图上可应用的运算:取MAX运算、取MIN运算和取N运算。并将可能性决策图应用于求解可能性规划问题,提出了新的算法PPUPDDs,来创建最优可能性策略:利用可能性决策图来压缩地表示可能性价值函数和可能性策略,通过可能性决策图表示来捕捉动作和效用函数中的一些规则,去实现可能性价值迭代算法,这使得算法PPUPDDs节省了大量的空间和计算时间。我们在Factory、Moat-Castle、Block三个可能性规划问题域上测试了PPUPDDs算法,都有优异的表现。