部分观测马尔可夫决策过程下的深海热液自主探测研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:green7116xxxx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深海热液是海洋的一种独特现象,热液喷口是地球板块运动的结果,也是近年海洋科学中最激动人心的发现。其附近不仅有大量易于开采的热液矿产,还是整个地球热循环重要的组成部分,是地质学家了解地球内部活动的重要窗口,其附近的生态圈是海洋生物学研究的前沿。因此寻找深海热液喷口有十分重大的意义。相比传统的探测方式,应用水下智能机器人进行自主探测的优势变得越来越明显。因此本文以深海热液自主探测为背景,研究基于化学传感器的自主探测。该问题可分解为两个子问题,在线构图和实时路径规划。本文基于部分观测马尔可夫决策过程(Partially Observable Markov Decision Process-POMDP),对8个要素进行建模,分别对两个子问题进行了研究,探求一种合理的在线构图和实时路径规划间的耦合关系。对于在线构图,在Shuo Pang, Jay A. Farrell等提出的羽状流模型的基础上,建立转移函数和观测函数,利用信念状态推导了在线构图的更新机制,得到化学源头概率分布地图和烟羽观测概率地图。并将该方法与原来的化学源头概率推断的贝叶斯方法进行比较,通过计算机仿真验证和陆地机器人试验验证,验证了新方法的可行性。对于实时路径规划,引入五种奖励和两种惩罚构建回报函数。采用价值函数迭代的方法求解,在线得到近似最优的价值函数,依据最优价值函数得到最优策略,从而指导机器人的规划。经过计算机仿真验证,验证了该理论指导机器人进行化学羽状流自主追踪和定位的有效性,并与结合Z型搜索的人工势场方法进行比较。本文还论述了陆地机器人试验平台的搭建过程,研究了陆地机器人室内定位。应用单目摄像头图像定位主要分为目标自动识别和建立从图像像素到实际位置的映射两个部分。本文研究第二个问题,基于最小二乘高斯核支持向量机进行黑箱建模,得到映射模型。对于训练参数的选择,本文采用K重交叉验证的方法选取泛化误差最小的训练模型。对于水下机器人化学羽状流自主追踪和定位试验平台的搭建,本文作了相应的论述,包括机器人载体的改装,软件部分的准备。该试验平台的搭建为今后利用水下机器人载体进行化学羽状流自主追踪和定位的试验验证奠定了坚实的基础。通过本文的研究,验证了应用POMDP方法研究基于化学传感器自主追踪的可行性,为在线构图研究提供了新途径,为实时路径规划研究提供了新的系统的方法和思路。
其他文献
脂质是人体内的一类重要物质,主要分为脂肪和类脂两大类。脂肪主要指三酰甘油(甘油三酯,TG),类脂主要指磷脂、胆固醇酯、类固醇及糖脂。正常人每100g肝脏湿重约含4~5g脂质,主要用于
<正>互联网思维可以用于商业模式建立与重塑,目标是琢磨出一套挣钱的方法并能够执行落地,在不同的维度和层面上实现更大的规模效益。林林总总的各类商业模式,本质上来看,我觉
随着海洋柔性立管的广泛使用,防弯器作为立管应用的关键附属构件,是我国开发深水油气资源必不可少的装备之一。对防弯器设计和分析的研究十分必要。海洋柔性立管防弯器的设计
在企业的财务管理中,财务报表分析是一项非常重要的内容,能够对企业的管理者提供有效参考。在对财务报表进行分析的时候,报表本身和分析方法之间都存在一定的局限性,从而导致
作者应用风险管理理论,陈述了基于风险管理的职业卫生监督模式的概念,探讨在职业卫生监督管理中实行职业病危害辨识、分析、风险评估、职业卫生管理质量评估和职业病危害控制
本文应用半参数模型识别经济转型时期中国的非线性菲利普斯曲线,这种非线性关系表现为三次多项式函数,拟合效果较好,统计检验显著。此外,本文给出了非线性菲利普斯曲线的经济学阐
MIMO技术通过提供空间分集增益或复用增益实现数据传输速率和频谱利用率的提高,因而在现代宽带无线通信中得到了广泛的应用。为了保证MIMO系统的容量和性能,在接收端进行精确
<正>发轫于2014年8月的国企新一轮深化改革,随着2015年5月国务院批转发改委《关于2015年深化经济体制改革重点工作意见》(以下简称《意见》)、国务院国资委发布《2015年度指
广泛性焦虑障碍以一种不受控制、没有明确对象或内容的恐惧,或提心吊胆的痛苦体验,或觉得有某种威胁即将来临,实际上并不存在威胁,即使有威胁也与其焦虑的程度不相称为特征。当前
报纸