基于可能性决策图的可能性规划

来源 :东北师范大学 | 被引量 : 0次 | 上传用户:aylwq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
早期智能规划研究一直集中在“封闭世界”假设之下的经典规划领域,然而,很多实际问题并不满足这样的假设条件,因此,一些学者将目光投向了不确定性规划的研究,其中概率规划的研究取得了一定的成绩,由于人工智能研究中的不确定性通常是顺序的、定性的,动作效果的概率在实际中往往很难获得,一些研究认为,可能性理论更适合解决那些概率模型无法解决或者概率信息很难获得的问题,提出可能性规划的概念,在可能性规划中,规划的初始世界状态是部分已知的,规划动作的效果按照对最终目标的完成效用被分成各个等级。然而,求解可能性规划的可能性价值迭代算法往往只能高效地求解较小的问题,尤其,伴随着域特征数目的增加状态空间的规模往往呈指数级增长,会陷入Bellman的维度灾难。同时,智能规划的求解方法由最初的用归结定理证明的方法求解规划,扩展为用STRIPS方法求解规划问题,及将规划问题转化为可满足问题来求解和采用模型检测的方法来求解规划问题。其中利用模型检测的方法求解规划取得了很好的成绩,在2000年规划大赛上,基于模型检测的MIPS(The Model Checking Integrated Planning System)规划系统,采用二元决策图(Binary Decision Diagrams)来压缩地表示规划状态,使得规划解的搜索空间得到有效的扩展。本文基于可能性理论和决策图理论提出一种新的决策图:可能性决策图,用于对不确定环境下的不精确的和模糊的信息进行编码,并用定理证明所提出的可能性决策图能规范地表示可能性命题公式,而且定义了可能性决策图上可应用的运算:取MAX运算、取MIN运算和取N运算。并将可能性决策图应用于求解可能性规划问题,提出了新的算法PPUPDDs,来创建最优可能性策略:利用可能性决策图来压缩地表示可能性价值函数和可能性策略,通过可能性决策图表示来捕捉动作和效用函数中的一些规则,去实现可能性价值迭代算法,这使得算法PPUPDDs节省了大量的空间和计算时间。我们在Factory、Moat-Castle、Block三个可能性规划问题域上测试了PPUPDDs算法,都有优异的表现。
其他文献
随着网络规模的逐渐增大,所储存数据的逐渐增多,安全性已成为网络建设的第一要素。访问控制作为实现数据保密性和完整性机制的重要手段,被美国国防部可信计算机系统评估标准T
随着互联网最近几年的迅猛发展,网络上的信息越来越多,开始进入网络生活时代。而如何能够快速、准确地找到自己所需要的信息,特别是短时间内爆发的突发性事件,变得越来越迫切
近年来,随着机械制造业的不断发展,用于残余应力消除的振动时效系统由于能耗少、污染低、作用周期短、操作简单,正在不断的替代传统的自然时效和热时效,得到了越来越广泛的应
网络流量异常指的是流量偏离正常模型。引起流量异常的原因有很多,比如恶意攻击、网络设备故障、正常的突发用户行为等。网络异常检测的目的就是及时检测出异常的发生,便于网
随着互联网的出现并不断发展,人们获取到的信息形式经历了从过去的文本、数字到如今的图像、语音、视频等多媒体的过程。当下三维模型在多媒体领域中的需求量大,该领域对三维
伴随着流媒体时代的到来,网络规模和应用获得了快速增长,为网络服务提出了新的挑战。传统的拥塞控制机制使用的是尽力服务模式,取得了一系列发展成果,为网络的健壮发展和性能
如何解决多企业间的快速互联协作一直是计算机网络研究中非常重要的研究课题。在目前网络技术迅速发展的背景下急需一种能为不同企业提供统一的快速互联协作机制的新型网络应
近年来,随着web2.0的迅猛发展,互联网不断扩展成一个拥有海量数据并且内容丰富的信息载体。并且涌现出一些新型的,与用户交互性强的知识服务形式,其中典型的服务包括百科知识
随着信息技术的快速发展,访问控制已成为保护网络信息安全的一种重要策略。基于角色的访问控制(RBAC)是一种先进的访问控制技术,在各企业组织中得到了广泛应用。职责分离(SoD
装箱问题是一类非常典型的NP-hard问题,具有很重要的理论价值与实际应用意义。这类问题的共同目的就是把若干“物体”放入指定的“箱子”中,而最终使用的“箱子”数最少。如
学位