分散式多机器人在网格环境下寻路策略与避障研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:zhangruidao11
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现如今多机器人系统已经成为机器人领域的重要研究方向,多机器人系统通过在环境中部署多台机器人来完成单一机器人难以完成的大型复杂任务。随着近年来人工智能领域和自动化领域的不断升级,多机器人系统凭借其高效、高质、均衡等特点在军事、生产、电子游戏等领域都展现出了强烈的需求。在多机器人路径规划这一研究中,根据控制结构的不同分为集中式规划方式与分散式规划方式。集中式规划是目前实际应用的主流选择,其优点为较为成熟的技术成果和一定规模下优秀的性能。该方式为全局每一台机器人规划具体指令来完成任务,整个系统可以视为具有一个大脑的“大型机器人”,在一定规模内具有良好效果。但是集中式规划方法在鲁棒性、灵活性、适应性存在不足,最主要的问题是大多数集中式规划在求解效率上会随着场景中机器人数量和环境复杂程度呈指数级别的上涨。面对目前愈加复杂的应用场景和不断扩展的系统规模,传统的多机器人路径规划方法已经不满足实际需求。为了上述多机器人规划的中诸多难点,本文基于分散式控制思想,对具有严格动作、位置限制的约束工作空间进行探索和研究,利用深度强化学习(Deep Reinforcement)方法应用于多机器人领域,解决多机器人在网格约束环境下的路径规划问题,本文以Proximal Policy Optimization(PPO)深度强化学习算法原理和框架作为基础,采用激光雷达传感器感知周边环境,深度神经网络提取数据中的潜在特征得到机器人动作策略。再结合探索策略、距离、时长、密度等阶段性回报函数诱导机器人学习到应对复杂情况的优秀策略。最后通过所搭建的仿真平台进行实验,从多个角度说明算法所训练模型的有效性,通过随机实验、复杂场景、大规模等实验验证了该模型能够指导机器人在大多数场景中能够以高成功率完成任务,并保证所执行的路径代价较低。同时在多种方法的对比试验当中显示该模型在时间代价上相比集中式方法更加适合大规模场景和复杂场景的使用,相比于其他分散式方法在规划效果更好。最后通过消融实验证明了Proximal Policy Optimization With Discrete Action(PPO-DM)算法在解决离散问题时原始PPO在离散动作上中后期探索不足的问题,证明了所提出密度回报函数对整体规划效果的积极作用。本文章扩展了深度强化学习运用于多机器人系统特殊约束路径规划的研究,对将深度强化学习用于自动化工厂领域具有一定的参考意义和实践价值。
其他文献
情绪是人们对日常生活的一种心理感受,它通常与逻辑决策、感知、学习、理性思考等密切相关。目前,基于计算机系统的情感识别是先进人机交互系统的关键部分。情绪识别具有重大的研究意义,一直是现代神经科学、心理学、神经工程和计算机科学等领域的研究热点。因此,本文设计了音乐诱发情绪实验,结合脑电图(Electroencephalogram,EEG)和行为数据解码受试者的神经信息并进行相应的经颅直流电刺激(Tra
学位
基层治理中存在的形式主义正在消解基层治理效能。基层治理中形式主义大致可分为制度形式主义、数字形式主义、组织形式主义三种样态,其消解基层制度执行力,导致数据赋能异化,消解组织引领力,是基层行政效率低下的主要原因。整治基层形式主义,要提升制度执行力,以制度优势驱动治理效能提升;要善用信息技术赋权增能,以智能加速治理效能提升;要推进基层党组织建设,以党建引领带动基层治理效能提升。
期刊
随着互联网在各领域的广泛普及和应用,大量工业数据及应用数据呈爆发式增长的态势。由于大多数数据的维度较高,且无法确保所有特征都被采集到,这导致传统神经网络算法使用人工合成值预填充数据这一过程变得极为低效。针对此,本文提出了以下两个研究内容:(1)隐特征分析方法可以高效提取高维不完备数据的完备特征,在协同过滤等问题上有较好的效果。但这类模型大多基于矩阵分解的思想,仅仅在于提取不完备数据的线性特征。自编
学位
工业物联网通过使用传感和网络技术为工业系统提供产品可追溯性,参与者能够有效地跟踪产品并在生产过程中记录其状态。当前的工业物联网系统的产品数据共享服务是有中心的,当参与者获得不可信的产品数据时无法溯源,DAG区块链可以解决这一问题。DAG区块链技术不仅具有链式区块链去中心及防篡改等特性,而且能够容忍分叉,效率更高,但是仍不能解决在DAG区块链上存储产品数据时存在的数据隐私安全问题。基于上述问题,本文
学位
形式主义是一个长期困扰基层治理的复杂社会政治现象,具有多方面的生成诱因和表现形态。在现代复杂性社会条件下,传统意义上的“政治运动式”“被动应付式”“单一施策式”等解决思路和治理对策对形式主义治理显得捉襟见肘。新形势下,要按照中央要求和部署,通过持之以恒深化治理改革、优化治理结构的角度去寻找解决良策。协同治理理论与解决当前形式主义问题在理念、举措、机制和效果诸多方面具有契合之处,有助于识别形式主义现
期刊
经济的迅猛发展促使人们生活质量的提升,生活质量的提升间接促使交通道路的高频率使用,道路里程数的逐年递增。国家为建成交通强国出台各项政策,支持智慧交通的建成,高质量的公路在其中扮演着重要角色。巨大的道路里程数导致公路养护存在着海量的工作,而养护中重点关注的危害就是路面的裂缝。裂缝应尽早发现,评估严重程度,做出对应的养护决定。早先的裂缝发现与检测工作主要依赖于低效率、低回报率的人工检测,如今面对如此巨
学位
随着化石能源的持续消耗,能源短缺与环境恶化的危机迫在眉睫。太阳能储量丰富、清洁可再生,是代替化石能源的理想选择。在传统的太阳能利用方式中,光利用技术只能响应光谱部分波段的太阳光,而热利用技术虽然可以响应全光谱的太阳光却降低了高频波段光子的能量品质。为提高整体的利用效率,太阳能综合利用技术已成为当前的研究热点。其中,基于光热协同反应将高频波段光子能量用于合成高附加值的太阳能燃料,基于辐射的热效应将低
学位
如今,随着Web 2.0的普及,社交网络在知识分享和新产品传播方面发挥着不可思议的作用。人们可以在任何时间、任何地点分享自己的观点,意见领袖是在社交网络中用户与用户之间的互动产生的。由于其在现实中的广泛应用,包括电子营销市场和信息教育等行业,识别意见领袖的问题一直吸引着越来越多的研究。现有的大多数学者在研究意见领袖识别问题时没有进行意见社区的划分,导致影响力重叠问题;同时由于在意见领袖的识别过程中
学位
数字图像作为信息时代的主要载体拥有极大的表达潜力,其获取、分发和存储的便利性使得它们被用来广泛传播信息。互联网的普及和计算机技术的发展导致人们可以轻而易举的对一幅图像完成篡改,而这些虚假信息的传播不仅会给社会带来危害也会影响决策者们在重要场合的判断。图像篡改根据其语义内容是否发生改变可分为局部篡改和全局篡改。全局篡改仅改变图像整体视觉效果而不改变其语义内容,常用于局部篡改操作之后,旨在隐藏局部篡改
学位
随着移动互联网的普及,网络上的信息数据不断增加,用户面临着信息过载问题,推荐系统就是在这种背景下产生的。推荐系统从大量动态生成的信息中过滤出重要的信息数据,深入发掘出用户的兴趣偏好。但在实际应用中,推荐系统的性能受制于评分数据的稀疏和用户的冷启动等各方面的问题。跨域推荐可以利用用户在其他领域内的交互数据来丰富当前领域的稀疏数据,再加上互联网应用中,用户画像和产品属性信息的丰富及多元化,推荐系统可以
学位