基于杂合标准的POMDP值迭代求解算法

来源 :模式识别与人工智能 | 被引量 : 0次 | 上传用户:sondenaclaire3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于点的值迭代方法是求解部分可观测马尔科夫决策过程(POMDP)问题的一类有效算法.目前基于点的值迭代算法大都基于单一启发式标准探索信念点集,从而限制算法效果.基于此种情况,文中提出基于杂合标准探索信念点集的值迭代算法(HHVI),可以同时维持值函数的上界和下界.在扩展探索点集时,选取值函数上下界差值大于阈值的信念点进行扩展,并且在值函数上下界差值大于阈值的后继信念点中选择与已探索点集距离最远的信念点进行探索,保证探索点集尽量有效分布于可达信念空间内.在4个基准问题上的实验表明,HHVI能保证收敛效率,并
其他文献
<正>讲到公文格式,一般是从正面告知该怎样、又当如何,可是学员一动手又往往出差错,这说明还应从反面涉及公文格式易见的错误,明白失在何处、怎样纠正,这样,从正误对比中加深
食品安全是关系到国计民生的重大事务,食品快速筛查则是食品安全检测的重要组成部分。传统的食品快速筛查手段往往会对检测对象造成损伤,而新兴的无损检测技术相较于传统的食
美国银行法施加于包括银行股东、董事在内的机构关联方特殊的法律责任,是其监管者在监管实践中所创制的监管措施,其目的是保护存款人及公共利益,防范金融风险.就美国银行股东
本文在分析现代大学制度的传统与现状的基础上,从大学的定位与特色、大学内部学术权力与行政权力之间关系、大学内部管理运行机制存在的问题入手,探讨改革影响现代大学制度内部
<正>地方人才发展规划是今后一个时期当地人才发展的纲领性文件,各地从自身经济社会发展状况出发编制人才发展规划。这些规划在反映各自特点的同时,也体现出鲜明的区域特色。
随着顶管工程的发展,一些过河过江顶管在进出洞时往往会涉及到较大坡度的顶进作业,尤其是下坡顶进作业,往往存在较大的安全质量风险。依托白龙港南线输送干线过江管工程案例,针对
工程的信息和档案资料管理是业主赋予监理的重要职责之一,是贯穿工程监理全过程的一项重要工作。监理项目部在履行职责过程中,主要按施工准备期、施工期、交工验收期及保修期
为了对复杂应力状态下的客车侧窗粘接结构进行强度校核,提出一种基于粘接面法向正应力和切向剪应力的粘接强度校核方法。采用有限元方法在客车行驶的扭转工况下对侧窗胶黏剂
近年来,胆胰疾病的诊治越来越多地依赖于内镜技术,ERCP和内镜下乳头括约肌切开术(EST)相关并发症的问题日渐凸显。术后出血为EST的严重并发症之一,其一线治疗包括各种内镜下操
本文较为系统地探讨了我国早期驻外使馆的历史作用,认为它具有了解外国情况;与驻在国政府交涉,为本国挽回权益;管理留学生;保护海外华人;使世界了解中国等作用。它的作用已远