SHP-VI:一种基于最短哈密顿通路的POMDP值迭代算法

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:yuantengfei1990
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于试探(trial-based)的值迭代算法是求解部分可观察Markov决策过程(partially observable Markov decision process,POMDP)模型的一类有效算法,其中FSVI算法是目前最快的算法之一.然而对于较大规模的POMDP问题,FSVI计算MDP值函数的时间是不容忽视的.提出一种基于最短哈密顿通路(shortest Hamiltonian path)的值迭代算法(shortest Hamiltonian path-based value iteration
其他文献
针对目前肉鸭养殖中细菌传染病发病率高、防治困难的现状,分离鸭疫里默氏杆菌,检测其抗药性程度,筛选合适的抗生素适宜剂量。从山东省内12个地区/市、河北省4个地区及河南省4
基本公共服务是与人民群众的最关心、最现实、最直接的切身利益密切相关,是公共服务的基础与核心。基本公共服务的质量和水平的差距直接体现为城乡居民实际生活水平和质量的
管理是人类社会活动的客观需要,整个人类社会通过管理而维系,通过有效的管理而发展,管理的水平也在很大程度上反映人类社会的文明程度。管理的重要目的之一就是为了形成一定
为加速我国经济增长方式从粗放型向集约型转变,作为教育与经济结合最紧密部分的职业教育,对促进这一转变将起到直接的作用。
HAUCK燃烧器在生产过程中,出现了火焰烧偏的故障,影响了沥青搅拌站的产量,延误了施工工期,通过现场分析几种原因,找到了解决方法,并顺利地的排除了设备故障。
基础设施(Infrastructure)泛指为社会生产和人民生活提供公共服务的物质工程设施;关联基础设施系统(Interdependent Infrastructure Systems,IIS)是由若干个相互关联、相互影响
利用发光细菌新鲜菌悬液进行毒性测试,研究了O3/UV降解喹啉过程中的毒性变化.研究表明,在选取的浓度范围内,无论是HgCl2还是喹啉,发光细菌发光抑制率(或相对发光量)与物质浓
对物理法提取活性污泥中的胞外聚合物(EPS)进行了优化.分别考察了超声时间、振摇时间、离心速度和时间以及加热时间对EPS的松散附着(LB)和紧密粘附(TB)提取的影响,得出污泥EPS物理法
在多靶点、小靶径定向井的定向钻进中,时常由于井斜、方位的难于控制,导致频繁起下钻,调整钻具结构,或者扭方位等施工,井身轨迹的变化大,导致其它施工难度加大,施工周期增加,
随着城市人口的集中和工农业的发展,如燃料燃烧、氮肥生产、固氮植物的培育和畜牧业的集约经营等人类活动向大气中排放的含氮化合物激增,使得大气氮沉降量不断增加.氮沉降的增加