一种基于因果图启发式的并行概率规划方法

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:SBRBWD0801
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
并行概率规划(PPP)是近年来智能规划领域中的研究热点。在并行概率规划问题中,放松了经典规划对所描述问题的严格约束,使得动作具有并发性和不确定性,从而能够更好的描述现实问题。然而,现有的两种针对PPP的主要求解方法都具有明显的缺点。一种是基于模拟抽样的方法,以规划器PROST为代表,求解质量相对较好,但求解速度慢;另一种是基于迭代深化的方法,以规划器Glutton为代表,求解速度相对较快,但求解质量差。因此,我们尝试使用新的方法来求解这类问题,并行概率规划问题不强求最优解,解题空间规模巨大,这些特点正是启发式搜索所擅长的应用领域,从而高效的启发式搜索方法成为我们的选择。目前,因果图启发式(CGH)是启发式规划方法中的佼佼者,并且该方法已经在经典规划领域中有不错的表现。而且考虑到PPP问题采用RDDL语言来描述,在RDDL语言中使用条件概率函数(CPF)来描述动作效果及状态转移,而CPF的结构形式则恰好可以较为直观的用于构建因果图(CG),所以我们引入因果图来对基于RDDL描述的PPP问题进行启发式求解。本文的主要启发式算法称为CGHRDDL,整体求解方法是使用rddlsim来模拟状态演化以及使用CGHRDDL引导搜索。具体的求解方法分为以下四步:首先从领域描述构建出因果图及领域转换图(DTG);然后根据CG和DTG,计算单个状态变量任意一对取值之间的转换代价;接着在rddlsim的模拟演化过程中,由CGHRDDL推送具有最佳估值的后继状态,其中状态的启发值定义为状态轨迹的转换代价和立即回报值的加权总和;最后累加在限定轮数内rddlsim状态演化的回报值,即为最终的求解质量。在PPP基准领域上的实验结果表明,在不允许手工干预和参数调整的前提下,本文设计方法的求解效果要好于PROST和Glutton。更进一步地,与其它的基本启发式相比,CGHRDDL的求解质量高于随机搜索,求解速度快于爬山法。这些都表明在经典规划领域中高效的启发式搜索策略可以扩展用来求解这一类非经典规划问题。而非经典规划问题由其特征可知更加具有现实意义和应用前景,更值得探讨先进的规划方法来求解它们。
其他文献
随着人工神经网络的发展,人工神经网络在神经科学的研究中占据重要地位。近期神经科学最新研究成果表明,大脑中神经信息不仅仅是通过脉冲发放频率进行编码,还可以通过脉冲精确定
分形理论是几何学的一个新的研究方向——分形几何学,因为其能够很好的模拟自然景物,又名大自然的几何学。除了具有普通艺术图案的特点之外,分形图形一般具有自相似性和无限的精
法医学家在做体表损伤司法鉴定时,往往需要综合考虑体表损伤面积大小、损伤区域皮肤颜色变化程度、相关鉴定标准等多种因素才能判定体表损伤级别。在研发新版本的“体表损伤
我国现行的城市排水系统中大部分还是以人工经验为主导的管理方式,信息化、自动化应用比较少。在日常调度中因人工主观经验及孤立调度,导致泵站排水耗电量大的等问题,难以满足当
随着数据挖掘研究的不断深入,群体智能越来越受到研究人员关注,作为其重要分支的蚁群聚类算法备受学者们青睐。蚁群聚类算法是受蚂蚁群体行为启发而设计的智能仿生算法,具有群体
航天嵌入式软件是面向航天领域的特殊的嵌入式软件,它的可靠性和健壮性直接关系到航天飞行器的安全。如果没有对软件进行充分的调试和验证,一旦出现问题,不仅造成飞行器的损毁,甚
随着形式概念分析在数据挖掘、知识发现等领域的深入研究,其理论的扩展也开始受到越来越广泛的关注。三元概念分析作为形式概念分析的一种三元扩展,是一种新的分析三维数据的理
洪涝灾害是世界上影响最大的自然灾害之一,城市洪涝灾害已经成为了世界性的难题。一个避免城市洪涝灾害问题的方法是通过提高排水系统输送水资源的效率减少因泵站溢流造成的人
网格计算最高目标是能够同电网一样使用网格中的资源,网格中的资源包括计算机,集群,计算机池、仪器、设备、传感器、存储设备、数据、软件等实体以及实体工作时所需要的软件和数
在对数据进行分类时,有效的特征提取方法是取得良好分类效果的重要前提。然而,由于现代信息的海量性、非结构性以及非线性等特征,使得特征提取成为模式识别、机器学习等领域的新