机器人导航POMDP算法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:benxiaohai10000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
部分可观测马尔可夫决策过程(POMDP)是一种用于制定序列决策的经典模型。在该模型中,智能体做出动作所产生的效果是不确定的,对环境状态信息的观测也是不完整的。因此,POMDP对于表达智能体在非确定环境下的序列决策问题而言是非常有效的模型。本文对POMDP基本理论进行了深入地研究,并分析了POMDP的复杂度及理论结果,对值迭代算法进行了改进。然后对POMDP模型在机器人导航控制的应用进行了仿真实验,并分析了仿真结果,对仿真实验中出现的问题进行了分析。首先,介绍了当前应用在机器人导航控制领域中的几个经典的智能控制算法,并介绍了本文要研究的POMDP理论的研究现状。然后,详细阐述了部分可观测马尔可夫决策过程(POMDP)的基本理论及数学框架。为了清楚地说明POMDP的基本思想和理论背景,给出了一个循序渐进的理论阐述过程:先详细阐述了MDP理论,然后在MDP的基础上引出了对POMDP模型的定义以及POMDP问题的求解算法。重点研究了POMDP的代表性算法,对其精确求解算法给予了深入的分析,并对值迭代算法进行了改进。最后,给出了POMDP模型实现机器人导航控制任务的各要素设计,应用POMDP模型解决了机器人在各种复杂仿真环境中的导航问题,完成了路径规划任务和环境建模任务。对于处在现实环境中的机器人来说,环境信息的部分可观测性主要表现在机器人通过传感器对环境的感知是否完全。本文在模拟声纳扫描环境的过程中,将声纳对环境信息观测的不确定性用概率的形式表现出来,并将其与POMDP模型的信度状态更新相结合,给出了一种新的控制模式。实验表明,POMDP算法能够在较为复杂的未知环境中有效地解决机器人的导航控制问题。
其他文献
随着社会科学技术的发展,传统的辨证论治出现是一些不适应性,刘师认为临证时在坚持中医理论基屈理论为指导,重视中医辨证为特长条件下,还应开拓思路,也于借鉴现代医学成果,进行微观
诗歌教学是高中语文教学的一个重要组成部分,在整个高中语文教学中占有一定的地位。现在的诗歌教学,往往只是根据课本的编排进行,显得零散而琐碎,在复习中不利于学生的整体把握。
针对干式空心电抗器匝间绝缘事故频繁发生的问题,提出了在振荡波下进行局部放电的绝缘检测方法,设计了一种能有效避免绝缘故障的干式空心电抗器绝缘检测系统.根据现场技术指
地图综合中,建筑物群的排列结构是需要重点考虑的因素。当不同排列的子建筑物群之间存在空间图形冲突时,这些建筑物群的综合就显得更为复杂。直线排列建筑物群的综合在大比例尺地形图上以典型化操作为主。本文提出一种相互之间存在潜在空间图形冲突的多个直线排列建筑物子群的渐进式典型化方法,渐进式地处理多个直线排列建筑物子群之间的空间图形冲突,保留建筑物群重要的直线排列结构;以建筑物表达的视觉图形约束为限制条件,自
品牌理论在发展,绍兴农业品牌建设也在发展.在回顾绍兴经济发展过程中农业品牌建设的历史轨迹与现状的基础上,分析了农业品牌建设成败原因,并提出了其路径选择.
大学生就业问题是社会普遍关注的热点话题。大学生就业难不仅是由于高校人才数量基数大,还与长期存在的地域歧视有密不可分的关系。简要概述大学生就业地域歧视问题,阐述就业
合作金融自19世纪50年代产生以来,已有100多年的发展历史。合作金融在各国金融体系中已经成为一个极富特色而又不可缺的有机组成部分。在我国农村合作金融经过了一段曲折的发
目的探讨颈痛颗粒治疗神经根型颈椎病的疗效机理.方法采用双盲双模拟平行对照法将神经根型颈椎病患者60例随机分为颈痛颗粒组(观察组)40例,根痛平组(对照组)20例,对比分析两
Aquaponic systems require energy in different forms, heat, solar radiation, electricity etc. Typical actuator components of an aquaponic system include pumps, a
利用1961—2008年云南125个观测站的逐日观测资料,采用百分位值法定义了云南极端气温、降水事件阈值,分析了极端条件下的高温、低温和强降水的分布特征、气候变化趋势及其与