基于环境状态分布优化的POMDP值迭代求解算法

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:hello_tyj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于点的值迭代算法是一类解决POMDP问题的有效算法,PBVI是基于点集的经典算法,但是其算法效率较为低下。FSVI使用内在的MDP最优策略来降低算法复杂度,但求解大规模问题的效果较差。为解决上述问题,提出了基于环境状态分布优化的前向搜索值迭代算法(PBVI-OSD),通过基于权重值的QMDP选出最佳的动作,基于信念状态和转换函数选取最大可能的状态,基于动作和状态从观察中随机选取一个观察概率大于阈值的观察,由此获得更具探索价值的后继信念点集,提升值迭代收敛的质量。在四个基准问题上的实验表明,相比于F
其他文献
从非结构化文本中联合提取实体和关系是信息抽取中的一项重要任务。现有的方法取得了可观的性能,但仍受到一些固有的限制,如错误传播、预测存在冗余性、无法解决关系重叠问题等。为此,提出一种基于图神经网络的联合实体关系抽取模型BSGB(BiLSTM+SDA-GAT+BiGCN)。BSGB分为两个阶段,第一阶段将语义依存分析扩展到语义依存图,提出融合语义依存图的图注意力网络(SDA-GAT),通过堆叠BiLS
期刊
大气环流对热带外海洋存在的不同尺度海温异常的响应研究一直是海气相互作用的热点问题,特别是广泛活跃的中小尺度海温异常对大气的影响.本文使用区域气候模式RegCM4.6,设计了三组不同初值的集合试验,研究了冬季北太平洋地区大尺度环流对黑潮延伸体(KE, Kuroshio Extension)附近不同尺度海温异常的响应特征,并探讨了可能机制.研究发现,大尺度环流对KE中尺度海温异常的响应呈现出广泛的正异
期刊
针对道路停车位识别与计数的问题,采用基于仿射变换与模板匹配的方法进行了研究。首先对采集的视频图像进行预处理,并采用基于PPHT与直线聚类的方法检测停车位候选区并计算出车位标线的倾斜角。然后采用基于仿射变换与模板匹配的算法检测停车位入口处标线并用红色圆标记。接着采用感知哈希算法剔除相似度较高的图像,将剩余的图像按顺序连接起来;最后采用动态规范法,Lagrange函数和Grubbs准则记录连接图中停车
期刊
为了减小加壳、混淆技术对恶意代码分类的影响并提高准确率,提出一种基于卷积神经网络和多特征融合的恶意代码分类方法,以恶意代码灰度图像和带有API函数调用与操作码的混合序列为特征,设计基于卷积神经网络的多特征融合分类器,该分类器由三个组件构成:图像组件、序列组件和融合组件,经训练后用于检测恶意代码类别。实验结果表明,相比目前已有的HYDRA、Orthrus等方法,该方法的分类准确率和宏F1值更高,表明
期刊
卫星导航信号的非理想性可使不同接收机之间出现测距偏差,是影响卫星导航系统服务精度和完好性的重要因素。本文针对北斗系统B1C、B2a新体制信号的非理想性进行分析,利用大口径天线采集了全部北斗三号在轨卫星播发的B1C、B2a信号(共27颗卫星信号),评估了不同接收带宽、码鉴相间距下测距偏差的大小与变化特点;进一步,以双频多星座星基增强服务应用为例,分析了两个信号在相应接收机中的设计约束条件。研究结果显
期刊
有机场效应晶体管(OFETs)、有机发光二极管等光电器件有望实现低成本柔性光电子应用,但低成本潜力取决于基于溶液法大面积沉积有机半导体单晶(OSSC)阵列的能力.然而,差的表面润湿行为和复杂的流体动力学过程限制了溶液沉积大面积OSSC阵列.本文中,我们通过添加微量的表面活性剂改善了润湿性能和流体干燥动力学,并增强了有机溶液对疏水表面的黏附力;将聚二甲基硅氧烷模板的凹槽结构作为限域空间用于OSSCs
期刊
随着社交网络平台的广泛使用,涌现出大量蕴涵丰富情感信息的在线评论文本,分析评论中表达的情感对企业、平台等具有重要意义。为了解决目前针对在线评论短文本情感分析中存在特征提取能力弱以及忽略短文本本身情感信息的问题,提出一种基于文本情感值加权融合字词向量表示的模型——SVW-BERT模型。首先,基于字、词级别向量融合表示文本向量,最大程度获取语义表征,同时考虑副词、否定词、感叹句及疑问句对文本情感的影响
期刊
主要针对城区不规则高层建筑目标三维成像算法进行研究,基于Attributed Scattering Center(ASC)模型,优化不规则复杂体高层建筑的GEO SAR重构算法。利用北斗GEO卫星作为辐射源,机载接收机作为信号接收平台,成像场景反射GNSS信号作为回波信号,建立以稀疏表示系数和字典为凸优化变量优化模型,提出一种基于变量分裂和增广拉格朗日技术的迭代方法。基于GEO SAR系统进行回波
期刊
现有的基于深度学习的单张图像超分辨率(single image super-resolution,SISR)模型通常是通过加深网络层数来提升模型的拟合能力,没有充分提取和复用特征,导致重建图像的质量较低。针对该问题,提出了基于特征融合和注意力机制的图像超分辨率模型。该模型在特征提取模块使用残差中嵌入残差(residual in residual,RIR)的结构,该网络的特征提取模块由包含多个残差块
期刊
多孔氮掺杂碳材料负载的Co单原子催化剂(Co-N-C)因其在电催化氧还原反应(ORR)中展现出优异的性能而受到广泛关注.通过对催化剂的设计和对反应条件的优化, Co-N-C可以电催化ORR得到水、过氧化氢等不同产物,因此在金属空气电池、燃料电池以及化工生产等方面具有重要的应用前景.然而,在不同条件下Co-N-C催化ORR反应的电子转移途径,即决定ORR反应选择性的关键因素尚无定论.本文综述了近年来
期刊