基于强化学习的多机器人全覆盖路径规划研究

来源 :重庆交通大学 | 被引量 : 0次 | 上传用户:yzq4308
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
全覆盖问题主要应用在一些需要获取环境信息或执行覆盖目的的场景下,例如灾后搜索、家政服务、农业和军事领域等,通常需要在有限的时间或资源消耗下完成。随着全覆盖问题规模的不断扩大,单个机器人往往难以满足问题约束,不能高效地完成全覆盖任务,具备并行性的多机器人协作执行越来越成为趋势。在多机器人全覆盖路径规划问题上,传统的方法和各类启发式的算法在实际问题的应用中存在优化效果不佳、难以求得全局最优解甚至可能出现机器人徘徊与死锁的现象。强化学习策略可以根据环境提供的状态信息实时优化策略对智能体进行动作选择的训练,能够提升智能体寻找到最优解的可能,而强化学习神经网络的部署方式具有无需重复求解的优势,大大减小了实际任务执行过程中时间和性能消耗。在多机器人的全覆盖路径规划问题求解过程中,合理的任务分配方法与有效的路径规划方法是两个关键步骤。前者关注多个机器人之间的协作性能,降低任务冲突和资源浪费。后者可使每个机器人能够高效地完成自己的任务。任务分配与路径规划可以互相独立,也能够二者合一。寻找一个满足任务冲突最低、时间最短、路程最短等要求的任务分配与路径规划算法是目前多机器人全覆盖路径规划问题的主要目标。针对上述挑战,本文针对两种主要的全覆盖问题模型提出了相应的算法:1.针对拓扑式的全覆盖路径规划问题模型,提出一种基于聚类的任务分配和指针网络的路径规划的算法。算法通过改进的K-Means对给定的任务节点进行划分,而改进的指针网络对划分后的每一个子任务簇进行路径规划。2.针对网格式的全覆盖路径规划问题模型,提出一种基于改进的优势时序演员评论家结构,并以异步和联合动作空间强化学习的方式进行训练。算法结合任务分配和路径规划两个环节,使多机器人具备在网格环境中无碰撞且尽量少的任务冲突下协作执行全覆盖路径规划的能力。两个算法分别关注拓扑式与网格式两种全覆盖问题下主要的建模方式,均成功地实现了多机器人的全覆盖路径规划。文章针对两种环境及对应的算法分别设计了实验,结果表明,强化学习在解决组合优化问题和多机器人协作问题方面相比于传统算法能够展现更强的性能和扩展性,能够在更短的时间内得到更好的规划结果。本文所提算法具备较高的实际应用价值。
其他文献
核电工业中对流体流量和温度的监测,有利于掌握和控制工业设备的运行状态,保证工业生产的安全性、可靠性和经济性。传统电学类流量计存在电磁干扰、体积大、多参数复合测量困难等问题,本文采用抗电磁干扰能力强、体积小、易于实现复合测量的光纤布拉格光栅(Fiber Bragg Grating,FBG)作为传感元件,针对光纤布拉格光栅流量温度复合传感器存在压损大、量程窄、结构复杂及精度低的问题,设计了一种基于光纤
学位
新能源汽车的出现能有效缓解化石燃料燃烧对环境污染造成的影响,能降低我国对石油的依赖。为了应对化石燃料不断枯竭的危机,以及响应国家的节能减排战略,新能源汽车目前也成为我国以及世界各大主流车企的重要发展方向,并且由于新能源汽车的高性能,低能耗等优点,新能源汽车也受到广大消费者的喜爱,对于国内外科研人员而言,新能源汽车的主要动力系统电机成为了各大企业和高校的研究热点。传统混合动力车用电机存在转矩密度小、
学位
在全球机动车事故中摩托车驾乘人员伤亡率远大于汽车,相关研究表明,事故多以未佩戴摩托车头盔造成头部致命伤为主,因此行进中摩托车驾乘人员头盔检测显得十分重要。然而,行驶中摩托车驾乘者头盔佩戴检测的研究却较少,以深度学习方式进行的相关研究则更少。因此,本文基于深度学习对摩托车头盔佩戴检测进行了相关研究。针对摩托车驾驶员头盔佩戴检测提出了改进YOLOv2算法,实现对摩托车驾驶员头盔佩戴检测。针对摩托车上多
学位
渐开线斜齿轮具有传动平稳、承载能力高、加工调整方便等优点,被广泛应用于航空航天、船舶海洋、风力发电、高速列车等场合。随着工业现代化的快速发展,齿轮传动朝着高转速、重载荷等方向发展,对齿轮提出了更高的要求。在高速重载的工况下,齿轮受载变形大、齿面温度高,导致齿轮冲击加剧,改变了齿轮的接触状态,甚至出现脱齿现象,增大了出现断齿故障的概率。因此,开展高速重载渐开线斜齿轮副冲击激励机理研究,阐明斜齿轮副冲
学位
热再生沥青混合料温度均匀性是影响沥青路面维修养护质量的重要因素,局部温度过低,沥青缺乏流动性,会影响混合料分散;局部温度过高,会加速沥青老化,超过200℃甚至会造成沥青烧焦失效。因此,为了获得温度均匀性良好的再生沥青混合料,本文针对热再生路面养护车搅拌加热过程混合料温度均匀性问题,依托浙江美通筑路机械股份有限公司合作项目以LMT5140型热再生沥青路面养护车为研究对象,对搅拌加热装置结构进行了改进
学位
<正>当前,全国各地不少监狱相继建立了陈列馆(室)或建有展览厅、荣誉馆等,并以多种形式展示新时代监狱发展的特点和特色。由于监狱工作的特殊性,各省监狱陈列馆(室)发展不平衡,特别是在规范性、统一性和标准性上存在差别;监狱文物保护利用不平衡不充分的矛盾依然存在,文物合理利用不足、传播传承不够,
期刊
城轨列车的精确定位,是实现列车自动驾驶、优化调度、安全监控等技术的重要前提。不论是节约能耗,还是安全保障,都与高精度的列车定位息息相关。因此,在满足安全约束条件下,如何尽可能地提高城轨列车定位精度,同时避免更昂贵的建设成本是目前的技术难点之一。本文在此场景下,提出一种基于深度学习和迁移学习的城轨列车定位新方法。本文的主要工作如下:(1)基于深度学习的城轨列车定位方法。针对使用轮轴速度传感器实现列车
学位
<正> 苯二氮(艹卓)类药物(BZ)由于毒性小,临床用途广,已逐渐替代巴比妥类药,成为当前临床应用最广的镇静安定药。本文旨在比较安定(D)、咪唑安定(M)、氟硝安定(F)对催眠、遗忘及全麻诱导时血流动力学影响。资料及方法一般资料选择ASA Ⅰ~Ⅱ级择期手术患者15例,男10例,女5例,年龄19~62岁,按用药不同随机分为D组、M组、F组,每组5例。麻醉方法术前肌注阿托品0.5mg。诱导分别静注安定
期刊
十二烷基苯磺酸钠(SDBS)作为常用阴离子乳化剂,对乳化沥青的应用十分广泛。为探究其分子结构对乳化沥青稳定性与破乳过程的影响,本文选取5种SDBS及其异构体,利用分子动力学模拟(MD)技术结合相关试验探究其分子结构对乳化沥青稳定性和破乳过程的影响。主要研究内容、结论如下:(1)通过MD构建了沥青各组分分子、沥青分子、SDBS乳化剂溶液等模型,并进行相应的动力学计算。采用密度、能量和温度、溶解度等参
学位
Zn2GeO4是一种具备微弱蓝白色发光性能的自缺陷型发光材料,作为基质材料时,通过离子掺杂,可显著增强其发光强度及稳定性能(发射波长则由基质晶体场及掺杂粒子能级性质共同决定),其中,过渡金属Mn掺杂Zn2GeO4被认为是一种用于光发射显示器件的优异绿色发光材料,相较于块体粉末,薄膜发光材料因具有均匀性好,附着力强,致密性高等明显优势,备受研发人员青睐。本文从Zn2GeO4:Mn溅射靶材的制备出发,
学位