多智能体Q学习在多AUV协调中的应用与仿真

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:monowing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
AUV(Autonomous Underwater Vehicle,简称AUV)作为一种高技术手段,在海洋环境监测、海底资源调查、科学考察、危险环境作业和打捞救生等方面起到了至关重要的作用。随着执行任务的复杂性日益增加,单AUV在大范围内作业的时效性、鲁棒性和柔性等方面就表现出明显不足。需要多个AUV构成系统来共同完成任务,而多AUV的协调控制成为关键问题,本论文主要讨论了一种新的多AUV协调控制方法、系统设计及仿真。本文首先介绍了多AUV技术的发展动态以及课题研究的意义,然后根据多AUV协调控制系统的需要建立AUV运动模型、多智能体Q学习模型,在此基础上建立了面向任务的多AUV系统结构。对比分析了近几年的几种重要的多智能体强化算法,然后提出了一种新的多智能体Q学习算法,这种算法结构简单,能够大大简化状态空间,加快收敛速度。试验表明,本文提出的多智能体Q学习方法是有效的。然后对多智能体Q学习算法实现多AUV协调的系统进行了设计,用多个仿真实例说明了多智能体Q学习算法在多AUV系统中的应用,试验证明,此本文提出的多智能体Q学习协调算法在满足Nash均衡的同时,避免了研究多个均衡点同时存在的问题,收敛速度快并且非常有效。
其他文献
随着航空运输市场竞争的日趋激烈,航空公司为了应对困境,不约而同地走上了合作发展之路。在各种形式的合作中,航空联盟是发展最为迅速、成效最为显著的一种合作方式。本文以
本文通过对荣华二采区10
期刊
随着2004:年12月“7918”国家高速公路网的实施,目前高速公路路网建设进入了高峰时期,随之投入运营的公路隧道也将不断增加。长大隧道的能源消耗惊人,一年的电费动辄数千万,运营能
目的:探究《石室秘录》中茯苓类方的组方用药规律,为临床处方的化裁提供必要参考.方法:利用IBM SPSS Statistics、R语言、IBM Modeler等数据挖掘软件对《石室秘录》中的茯苓
随着教育事业的发展,高等教育也在不断的变革,对高校辅导员的工作和管理提出更高的要求,需要和高校管理需求以及学生特点进行结合.高校辅导员作为高校学生管理中的重要力量,
摘要:随着我国城市轨道交通快速发展,线网规模不断扩大,运营里程不断增加,北京、上海和广州等大城市,轨道交通已进入了网络化运营时代。对于城市轨道交通线网,联络线布局设计
汽车制动器是关系到行车安全的关键设备,其质量至关重要,而完善的测试体系和良好的测试设备是保证产品质量的前提和基础。 开展汽车制动器惯性试验台架的研究,使其能更好地模