基于后验信念聚类的在线规划算法

来源 :计算机工程 | 被引量 : 0次 | 上传用户:linfenrir
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在连续状态的部分可观察马尔可夫决策过程中,在线规划无法同时满足高实时性与低误差的要求。为此,提出一种基于后验信念聚类的在线规划算法。使用KL散度分析连续状态下后验信念之间的误差,根据误差分析结果对后验信念进行聚类,利用聚类后验信念计算报酬值,并采用分支界限裁剪方法裁剪后验信念与或树。实验结果表明,该算法能够有效降低求解问题的规模,消除雨复计算,具有较好的实时性和较低的误差。
其他文献
小组合作学习有利于学生综合素质的培养,是课堂教学的重要组织形式,体现了“我的课堂我做主”、还课堂给学生的教学理念。
在《农作物生产技术》课程的教学实践中,笔者总结了在教学中采用项目教学法的具体操作——项目教学法的教学过程、教学内容、学习形式、考核评价等,并根据教学的实际情况和实践
我国高等教育教学中普遍开设了各学科专业的文化素质选修课程。这类课程受众面广,受众对象的专业知识构成复杂,其讲授内容及考核方式没有统一的标准。本文阐述了高校中此类教学
本文通过对安全评价中安全检查表应用情况的深入分析,针对其存在的缺点进行改进,并运用事故树理论对危险因素进行划分,定量的计算出矿井的危险度值,提高了煤矿安全评价结果的
本文介绍了几种建筑节能用调光玻璃,包括电致调光玻璃、热致调光玻璃和液晶调光玻璃,阐述了其工作原理,综述了调光玻璃的研究现状。
针对从滇池中分离到的28株芽孢杆菌,用扩增rDNA限制性酶切片段分析法(ARDRA)进行了初步分类,共获得5个操作分类单元(OUT),其中OTU5为主要类型,包括14株细菌菌株.同时,以铜绿
提出一种不含对运算的无证书隐式认证及密钥协商协议。该协议基于离散对数问题和可计算Diffie-Hellman假设,仅需要3次指数运算和2次散列运算,可避免复杂的双线性对运算。在随