特定路网环境中多对象集中式运动协调策略的强化学习算法研究与实现

来源 :北京交通大学 | 被引量 : 3次 | 上传用户:smarttiger1986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,智能体技术的应用使得人类避免了许多重复、危险的任务。由于任务复杂度的提高,单个智能体无法满足需求,多智能体系统应运而生并被应用于工业、军事、航天等多个领域。在多智能体系统中,移动智能体系统是应用最广泛的一个分支。移动智能体系统通过智能体间的协同工作共同完成任务,而多个智能体在移动过程中可能会发生碰撞,如何协调多智能体的运动是移动智能体系统的重要研究课题之一。本文的研究目标是在一个包含路网的二维场景下,以车式移动机器人为研究对象,利用强化学习的方法生成一个运动协调策略保证多机器人在运动过程中不发生碰撞,并且整体运动时间尽可能短。针对特定路网环境下的多机器人运动协调问题,本文提出了一种结合双深度Q网络(Double Deep Q-Network,DDQN)方法的多机器人集中式运动协调强化学习算法。论文首先采用场景划分和基于矩形包围盒的碰撞检测算法得到机器人路径间的碰撞区域,然后利用本文设计的路径切分与转化方法将碰撞区域与路径集合转换成一种特定的路径棋盘图模型,该模型提供了强化学习训练中与智能体交互的环境,最后设计了环境的状态空间、智能体的动作空间以及环境的奖励模型,并利用DDQN方法在路径棋盘图模型环境中迭代训练,得到可行的运动协调策略。为了验证本文提出的算法的正确性和鲁棒性,本文在Pycharm开发环境下利用PyQt应用程序框架搭建了相关实验平台。通过大量的仿真实验表明,本文提出的算法能够有效地解决多机器人运动过程中的碰撞问题,具有实际的应用价值。
其他文献
季羡林论说最喜欢的人,有一句话叫“骨头硬,心肠软”,令人吟诵不忘、回味无穷。硬骨护心灵,柔肠扶硬骨,软硬互补,和谐共融,才是正常的人生。鲁迅先生有“横眉冷对千夫指”的骨气,也有
期刊
后现代主义是20世纪后半叶在西方流行的一种社会文化思潮,其影响业已波及哲学、文学、政治、艺术、历史、教育等诸多领域。它以西方发达国家于二次世界大战后已进入后工业社会
9月9日,第4届“中国商标节”闭幕式暨“2011消费者最喜爱的绿色商标”颁奖仪式在成都举行。来自国家工商总局、国家商标评审委员会、中华商标协会的代表以及四川省市有关领导
社会信息化浪潮深刻改变着人们的生活方式,也影响着企业的生产经营模式。作为信息化重要载体的电信运营商,面临着前所未有的挑战与机遇。特别是在3G和全业务运营的环境下,电信企
司马迁经济地理思想,通过《史记·货殖列传》得到集中反映,这一思想的形成,与当时社会经济发展的客观条件分不开。一司马迁生活的时代,是西汉王朝的鼎盛时期。其间高度的中
创意立体裁剪综合运用立体裁剪技术和创意思维规律达到设计思维的实现,其设计过程是创意设计思维的表达,从创意的角度研究立体裁剪技术,用立体裁剪的方法引导设计师的思维走向,拓
目的分析哈氏棒在急性不稳定性胸腰椎骨折治疗中的应用效果。方法回顾性分析我院2013年1月至2015年6月收治的21例不稳定性胸腰椎骨折病例资料,均采用哈氏棒内固定进行治疗,并
在一般的商品进销存核算工作中,存在着大量的数据查找、登记、计算和汇总工作。用手工解决,是费时费力劳神的事情。靠自己开发软件来解决这些问题,并不是每个会计人员都能办得到
新疆伊宁县招商部门负责人称,新上马的黄金冶炼项目,日产精金粉可达300吨,项目前期投资5亿元,建成后年产黄金可达5吨左右,产值30亿元人民币左右、年利润2亿元左右、年利税1亿元以
校企合作模式为广大高校与企业合作培养人才探索出了一条新的道路,促进了校企之间的深层合作和良好发展,对教师核心能力的发展也提出了新的要求。本文探析了在校企合作背景下