基于循环卷积神经网络的POMDP值迭代算法

来源 :计算机工程 | 被引量 : 0次 | 上传用户:CNXF
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于卷积神经网络的部分可观测马尔科夫决策过程(POMDP)值迭代算法QMDP-net在无先验知识的情况下具有较好的性能表现,但其存在训练效果不稳定、参数敏感等优化难题。提出基于循环卷积神经网络的POMDP值迭代算法RQMDP-net,使用门控循环单元网络实现值迭代更新,在保留输入和递归权重矩阵卷积特性的同时增强网络时序处理能力。实验结果表明,RQMDP-net在10×10网格地图规划任务中导航准确率高达98.5%,且在36×36网格地图规划任务中相比QMDP-net最多提升5.8个百分
其他文献
通过对乳腺癌及甲状腺癌相关领域共识、指南或规范与临床实践相关碰撞进行总结,探索并思考在日常临床工作中如何合理运用及遵循指南,包括乳腺癌筛查、甲状腺微小乳头状癌诊疗
目的:分析医学生对所就读专业的认可度,并探讨相关对策。方法:通过向广州医科大学619名学生开展问卷调查,收集数据并进行统计学分析。结果:不同年级学生在专业认知维度存在差
运用网络信息技术可以优化高中地理课堂,教师在创新教学手段的过程中要充分利用网络资源,提升地理教学质量。要运用网络高效备课,运用网络资源导入新课,要为学生自主学习提供
针对基于深度学习的目标跟踪算法模型参数多、难以部署于嵌入式设备上的问题,提出一种改进的孪生卷积网络实时目标跟踪算法。设计一个非对称卷积模块来构建整个网络框架,通过非对称卷积模块的压缩层减少模型参数量,利用非对称层进行特征融合,以在保证精度的同时压缩模型大小。使用三元组损失函数代替逻辑损失函数进行模型训练,在输入不变的情况下提取表达性更强的深度特征,从而完成目标跟踪任务并提高模型的跟踪精度。在GOT
文章以合肥市某临近地铁1号线区间隧道的深基坑为工程背景,探究基坑施工对轨道交通结构的影响,基坑东侧临近地铁线路,采用排桩+斜撑支护方案。采用有限元数值模拟分析和动态
目的探讨精细化护理对结肠息肉电切术后患者舒适度及血糖影响。方法将2018年4-9月住院的328例结肠息肉患者作为研究对象,根据患者性别、年龄、疾病类型均衡可比的原则分为对
医学院校实验室是培养医学生创新能力、实践动手能力和操作能力、实施素质教育的重要场所,同时也是医学院校教师和实验技术人员进行实验教学、科研项目研发及创新的重要基地
文章以国内某电站下水库为例,该拦砂坝坝基为淤泥质土,土层的力学性质比较差,土质的均匀性不好,且在受压状态下会产生液化,经检验其地基承载力只有80kPa,承载力小,不适宜做水
临床指南是建立在大量循证医学证据基础上对临床实践有指导意义的重要文件。结合临床实践中遇到的常见心血管疾病及其相关指南,通过对指南应用中的个体化治疗、诊疗指南完善
目的调查糖尿病低血糖患者诱发心血管事件的现状,探讨护理应对措施。方法选取医院2018年6月—2019年12月住院部接诊的糖尿病患者为研究对象,根据是否低血糖分为低血糖组(205