采用核增强学习方法的多机器人编队控制

来源 :机器人 | 被引量 : 0次 | 上传用户:harryvincent
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种分布式的核增强学习方法来优化多机器人编队控制性能.首先,通过添加虚拟领队机器人,结合分布式的跟随控制策略,实现基本的多机器人编队控制;其次,提出结合最小二乘策略迭代和策略评测的核增强学习方法,即利用基于核的最小二乘策略迭代算法离线获取初始的编队优化控制策略,再利用基于核的最小二乘策略评测算法实现编队控制策略的在线优化.最后,编队实验结果显示算法能够实现自适应优化控制,提高多机器人的编队控制性能.
其他文献
静电易吸附灰尘,造成集成电路和半导体元件的污染而破坏产品的成品率。设计出了主要针对工业生产流水线的作业环境的静电消除器。通过人机工程学的一些数据分析,设计中还重点
目的:探讨高血压前期患者的升主动脉可扩张性特征及其危险因素.方法:入选我院接受回顾性心电门控冠状动脉计算机断层摄影术(CT)成像检查的健康体检或临床怀疑冠心病的所有患者.共
农民工阶层在社会分层视阈中处于弱势地位,他们是社会上的弱势群体,其审美文化诉求似乎处于空白状态,但由于农民工阶层在年龄、受教育程度上的特殊性,这决定了其审美文化创造
目的:探讨体育运动是否对大学新生的社会适应能力有影响。方法:采用问卷调查法、结构方程模型、数理统计法等,对湖北省7所高校共858人(男生436人,女生422人)进行了体育运动与大学
教育体罚存废之争由来已久,如今仍是各国教育关注的重心与热点。体罚作为学校管理学生的有效手段,在很多国家流行。美国施行地方分权制,教育权由州政府把控,是否禁止教育体罚
观音阁土话的变调分为轻声变调和连读变调,轻声变调主要有重叠轻声和虚词轻声;连读变调分二字组和三字组,二字组的变调形式有三种:前变型,即前字变调,后字不变调;后变型,即前
随着新课程改革的深入推进以及信息技术的迅猛发展,网络的利弊越来越引起人们的关注。为了更加有效地实施信息技术教育,我们需要认识网络,认识信息技术。并且认识到网络不是
冀中民间乐社演奏着大致相同的曲目,体现为结构性特征,即通过个体身体实践、集体仪式固化的整体性结构。一个人对一批曲目的记忆可能是偶然的,但一群人对一批曲目的记忆却不
建立了履带式移动机器人的数学模型.模仿人工驾驶过程中的预瞄行为,提出了一种移动机器人路径跟踪的模糊控制方法.用距离误差和预瞄角度误差作为控制量建立角速度控制器,实现对匀
在高校土建类专业学习过程中,钢结构识图是必修的课程,而这一课程最为显著的特征就是抽象且专业,所以教师在教学过程中也颇有困惑,而BIM技术的有效应用则能降低这一课程的难