论文部分内容阅读
近二十年来,智能规划方法在求解速度和求解范围上取得了飞跃,其主要的推动是基于启发式搜索的规划方法。学界对该类方法中的启发函数进行了大量研究,设计了很多有效的启发函数。启发函数的作用是引导搜索算法在状态空间上经过较少的状态即能发现目标状态。本文研究运用新的搜索方式来降低搜索算法所需经历的状态数量。本文运用的搜索方式包含状态空间的普通扩展和状态空间的“前瞻”式扩展两种策略。在普通扩展策略下,每次扩展使用单个动作;在“前瞻”式扩展策略下,每次扩展使用多个动作构成的“动作串”。动作串称为“宏动作”(Macro Action)。不同于传统的搜索过程,增加了“前瞻”策略的搜索过程不仅能以单步方式向前扩展而且能以相当于两步以上的连续多步方式向前扩展。因此,该搜索过程有望通过更少的状态访问发现目标状态、完成规划求解。本研究的关键是计算宏动作的新方法。不同于学界已有的仅仅利用“松弛规划图”信息构造宏动作的方法,本文提出了结合松弛规划图和‘’Landmark知识”两类信息的新方法。本方法依据“松弛规划解”确定宏动作的候选动作和候选顺序,依据“Landmark知识”调整候选顺序,采用增量构建的方式计算尽可能长的宏动作。本方法的特色在于,松弛规划图反映了在不考虑动作的“删除效果”情况下的动作顺序,Landmark知识反映了在考虑动作的“删除效果”情况下的动作顺序,两类信息的结合有望构造长度更大的宏动作,从而引导搜索算法以更多的等价步数向前搜索。本文在总结启发式搜索方面相关概念与进展的基础上,介绍我们提出的基于“前瞻”策略的贪婪最好优先搜索算法、基于松弛规划图和“Landmark知识”的宏动作构造算法。通过具体算例说明了本文方法在构造宏动作时的优势。算法在国际前沿的智能规划系统LAMA上进行了设计与实现,形成了规划系统LAMA-Macro。在国际标准测试问题集上的初步测试表明,LAMA-Macro在扩展结点的数目上优于LAMA。