脑启发的多智能体协同方法研究与实现

来源 :浙江大学 | 被引量 : 0次 | 上传用户：ywl1241

【摘要】

：

【作者】

：

陈焜

【机构】

：

浙江大学

【出处】

：

浙江大学

【发表日期】

：

2023年01期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

分布式控制的多智能体系统（Multi-Agent Systems,MASs）具有灵活性强、鲁棒性好等优势,但在机器人、无人机等集群系统中往往受到计算能力、通信环境、能量消耗等限制。如何设计以任务为驱动的计算和高效利用通信资源的机理成为亟待解决的关键科学问题。近年来,人工智能和脑启发智能技术的不断发展为多智能体执行协同任务提供了新的研究思路。因此,本文研究如何使用脑启发的认知仿生机制建立相应的系统模型来解决多智能体协同“编队”和“避障”这两类场景下的问题。针对“受限于通信资源的多智能体协同编队”这一问题,如何在有限的通信以及计算资源的前提下,实现智能体之间高效的合作机制是目前研究中的重点和难点。本文搭建类似于联邦学习的去中心化控制的系统模型,实现智能体之间在不直接“沟通”情况下依旧能够完成智能群体的协同。在算法层面,本文提出结合脑启发的共识主动（Stigmergy）机制与异步优势Actor-Critic（A3C）的“A3C-S”算法来解决这一问题。具体来说,共识主动机制可以在开始阶段将智能体吸引到信息素浓度高的位置,而A3C算法可以在智能体围绕目标点移动时协调智能体之间的行为,在高效完成系统任务的同时降低了对网络通信的负担。针对“多智能体协同避障中传感器资源优化”这一问题,如何结合多传感器丰富的环境感知能力的优势,让智能体可以在执行特定任务时以尽可能少的传感器资源开销而保持稳定的性能是亟待解决的关键问题。本文借鉴脑启发的注意力（Attention）机制,设计了一种多智能体系统合理分配有限资源的方法,从而将更多资源集中在关键任务,为解决以上问题提供了一种新的思路。特别地,本文提出了基于DQN架构的脑注意力启发的传感器智能选择方法,通过传感器在工作时依照环境所需进行“注意力”动态调整,从而减少机器人在探索环境过程中不必要的传感器开销。此外,利用ORCA算法将机器人之间近距离通信获得的信息与传感器的智能选择结果结合,实时规划机器人的运动速度从而完成整体的路径规划与避障。最后,本文使用Webots仿真平台及KEHEPERA Ⅳ机器人平台来验证模型的有效性。经过大量仿真和实验的训练和测试证明,本文使用的脑启发方法相较于传统的运动规划算法或是机器学习算法,在系统模型的搭建难度以及算法的性能等方面具有更大的优势,这也为脑启发机制在多智能体协同任务场景的应用提供新的思路。

其他文献

浅析中学生心理健康教育中的主体因素

＜正＞学校在进行教育教学工作的过程当中,学生的心理健康教育是不可或缺的一部分。教师、家长和学生自身都会对学生的心理健康教育进行有效影响,教师与家长发挥着至关重要的作用,朋友会对学生进行一定程度上的心理辅导,另外学生也要对自身进行教育,这样才可以使自身的心理达到健康的理想效果。中学生的心理健康教育是十分重要的,良好的心理状态才可以为学习生活打下良好的基础,从而使自身的综合素质得到有效提高,推动全面发

期刊

“打开”情景交融体会民族审美心理——高中语文教材必修上第七单元的设计与实施

＜正＞【任务群解读】高中语文教材必修上第七单元“自然情怀”，和同册的第一、三两个单元，同属“文学阅读与写作”任务群。课标中明确，该任务群要引导学生阅读古今中外诗歌、散文、小说、剧本等不同体裁的优秀文学作品，使学生在感受形象、品味语言、体验情感的过程中提升文学欣赏能力，并尝试文学写作，撰写文学评论，借以提高审美鉴赏能力和表达交流能力。其主要的学习目标和内容有：1.精读古今中外优秀的文学作品，感受作品

期刊

光频域反射计的多点多频分布式振动传感技术研究

现今社会正在快速进入5G物联网时代,作为物联网技术重要组成的感知技术,也迅速地向智能化、网络化、全方位立体感知方向发展。在感知技术中,分布式光纤传感器因其体积小、抗电磁、耐腐蚀、耐高温等优势有着巨大的发展潜力。光频域反射计（Optical Frequency Domain Reflectometry,OFDR）作为分布式光纤传感器的分支,更是以高精度,快速的动态响应等特性从各种传感器中脱颖而出,吸

学位

基于光频梳的高精度太赫兹频率测量

随着信息化时代的飞速发展,太赫兹（THz）技术受到越来越多的研究关注,部分突破性成果已成功应用于通信、雷达、成像、谱分析等领域。太赫兹波介于微波和红外波之间,相较于微波,太赫兹波的频谱资源更加丰富,能为通信提供更高的载频、更快的速率,也能为雷达提供更大的带宽;相较于红外等更高频光波,太赫兹波具有更低的光子能量、更好的安全性、更强的穿透性。然而,受限于目前太赫兹的收发技术手段和效率,太赫兹信号的分析

学位

基于皮肤电势的情绪识别与信号特征研究

情绪识别技术在人机交互、医学应用等领域具有广阔的应用前景。赋予计算机理解人类情绪的能力将使得计算机在各种应用中更有意义和强大。皮肤电势（Skin Potential,SP）信号是一种记录皮肤电反应过程的生理信号,在过去曾被证实与人类情绪有关,可能具备应用于情绪识别领域的潜力。然而,一直以来对该信号关注的不足导致其缺乏深入系统的研究。基于此,本文对皮肤电势信号的性质特征进行了研究并提出了一种基于皮肤

学位

基于生成对抗网络的交互式线稿着色方法研究

图像着色课题的研究目标是对灰度图像或黑白线稿添加颜色,可以应用于医学影像着色、老照片色彩重建、漫画线稿着色等场景,具有丰富的实际应用价值。近年来,受到深度学习发展的推动,出现了许多出色的着色模型,但是其着色结果仍存在着颜色混杂、溢出和细节缺失等问题。因此,本文针对漫画线稿着色这一应用场景及当前主流着色算法存在的问题,提出了两种基于生成对抗网络的交互式线稿着色方法,可以根据参考图像的颜色分布对漫画线

学位

短包通信场景下的极化码短码传输方案研究

随着生活水平的提高和日益增长的需求,用户对端到端时延、峰值速率和移动性等有了更苛刻的要求,新一代通信技术（5G）应运而生。面对如此多样化的性能需求,3GPP组织确定了5G三大主要的应用场景:增强型移动宽带（e MBB）、大规模机器类通信（m MTC）和超可靠与低时延通信（URLLC）,并且将LDPC码和极化码作为e MBB场景的信道编码方案。在2019年底后续演进方案中,Release-17标准明

学位

基于深度强化学习的TCP控制方法研究

上世纪80年代,研究人员提出了传输控制协议（Transmission Control Protocol,TCP）并在网络中得到了极为广泛的应用。拥塞控制是TCP协议的关键组成部分,目的在于在避免拥塞的前提下保持尽量高的网络利用率。既往的传统拥塞控制方法多数为基于规则的方法,不能很好地适应当前高度动态的网络环境。深度强化学习（Deep Reinforcement Learning,DRL）具有自主探

学位

多传感器SLAM的后端优化及回环检测方法研究

随着传感器、芯片、人工智能算法等技术的发展,自动驾驶逐渐成为热点。同步定位与建图（Simultaneous Localization and Mapping,SLAM）是自动驾驶系统中智能导航和环境探索的基础。SLAM可被分为里程计（前端）、后端优化、回环检测和建图四个模块。本文主要关注后端优化和回环检测,针对实际场景下如何融合多传感器信息估计出误差小、一致性强的运动轨迹以及如何提升现有回环检测算

学位

基于基本问题的写景抒情散文的深度学习——以高中必修上册第七单元为例

基本问题是围绕学科大概念设计的，目标是追求真正的“理解”。在指向学科大概念的基本问题的使用过程中，学生通过实践、质疑、合作、探究等方式阅读与表达，不断建构语文学科思维。在指向元认知的基本问题的使用过程中，学生通过反思、总结、评估等方式不断完善学习品质和学习方法。基本问题的设置和使用能帮助学生在深度学习中提高认知能力和学习品质，但课堂并不是学习的终点，随着未来对基本问题的追问与思考，一切还将不断深入

期刊

脑启发的多智能体协同方法研究与实现

与本文相关的学术论文