几类多智能体系统的迭代学习控制研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户：jerryweimao

【摘要】

：

【作者】

：

郭之恒

【机构】

：

华南理工大学

【出处】

：

华南理工大学

【发表日期】

：

2023年01期

【基金项目】

：

国家自然科学基金项目“广义多智能体系统迭代学习控制的自适应优化方法及应用”（基金号:62173151）；

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

迭代学习控制是一类适用于不需要精确建模且有重复运动性质的复杂被控系统的智能控制方法,其能够在有限时间区间上通过不断迭代来修正跟踪误差,最终实现系统的实际输出轨迹对期望轨迹的完全跟踪。多智能体系统是由多个智能体组成的复杂网络化系统,通过智能体之间的协同交互和信息传递共同完成任务,针对具有周期性运动性质的多智能体系统,计算简便且效率更高的迭代学习控制方法被逐步应用进来。广义多智能体系统是比常义多智能体系统更具有一般性的系统,在实际的工程领域、航天领域和交通领域等有着更为广泛的应用。本文重点研究了几类多智能体系统的迭代学习控制问题,对迭代学习控制理论的进一步推广和完善具有重要意义。本文主要研究内容如下:1.探讨了一类具有状态时滞的单边Lipschitz非线性多智能体系统的迭代学习一致性控制问题,提出了一种开环P型分布式迭代学习控制算法,借助于单边Lipschitz条件给出了算法的收敛条件并进行理论分析,用数值仿真验证了该算法的有效性。2.考虑了一类具有状态时滞的异构线性多智能体系统的输出跟踪问题,分别设计开环和闭环PD型分布式迭代学习控制算法,给出了两种方法的收敛条件并进行了严格证明,结合数值仿真图探讨了该系统在开环和闭环算法控制下的收敛速度问题。3.讨论了一类广义线性多智能体系统的状态跟踪问题,基于矩阵奇异值分解理论,提出了一种新型的连续时间域和离散时间域统一的P-P型分布式迭代学习控制算法,该算法针对系统不同的状态分量,由两部分P型算法混合而成,并给出了所提开环算法的收敛性分析,两个数值仿真实例验证了该算法的有效性。且分析了该系统在有界状态扰动下迭代学习控制的鲁棒性问题。另外,将该类系统推广到含状态时滞的广义线性多智能体领域,并提出了一种连续时间域和离散时间域统一的闭环PD型分布式迭代学习控制算法。4.研究了一类单边Lipschitz广义非线性多智能体系统的迭代学习一致性控制问题,采用一种闭环D型分布式迭代学习控制算法,利用单边Lipschitz条件和二次内部有界条件进行了算法的收敛性分析,仿真实例表明了系统在该算法的作用下,实际输出轨迹能够完全跟踪上期望轨迹。5.针对一类具有多个领导者的广义非线性多智能体系统,跟随者和领导者们之间的通信拓扑为固定不变的有向图,基于迭代学习控制方法,在连续时间域和离散时间域上研究了其包容控制问题,理论分析和数值仿真表明该算法保证了在有限时间区间上,跟随者状态与领导者状态所形成的凸包之间的包容误差是有界的,且在没有初始误差的情况下,当迭代次数趋于无穷时,包容误差收敛到零。

其他文献

基于输出反馈Q学习的未知离散系统跟踪控制方法

在控制系统的设计上,线性二次跟踪（linear quadratic tracking,LQT）问题是一个重要的研究领域。LQT的目的是为了设计一种控制器,使得其输出信号通过最小化预定义的性能指标以最优的方式跟踪上参考信号轨迹。将基于状态反馈的强化Q学习（Reinforcement Q-Learning,RQL）方法应用于LQT问题可以求解线性系统动力学信息未知的情况,但是需要系统状态变量是完全可测

学位

全面谋划推进提升综合能力——第十一届国家综合防灾减灾与可持续发展论坛观点摘要

＜正＞今年是"十四五"开局,在防灾减灾日期间,国家减灾委员会办公室、应急管理部联合部署开展防灾减灾宣传周活动,全国各地围绕防范化解灾害风险、筑牢安全发展基础为主题,广泛开展防灾减灾救灾宣传教育和应急演练工作。5月11日,第十一届国家综合防灾减灾与可持续发展论坛在兰州举办。百余位专家学者齐聚黄河之滨,围绕"全面推进自然灾害防治体系和能力现代化"主题开展交流讨论,为国家自然灾害防治体系和防治能力现代化

期刊

基于确定学习的轴流压气机旋转失速研究平台实现

对于航空发动机来说,其气动稳定性问题主要来自于压气机,旋转失速和喘振是两种主要的失稳现象,这些现象对于发动机的性能和安全性带来了极大的威胁。通常认为旋转失速是喘振发生的先兆,因此对压气机的旋转失速现象开展研究,做到对旋转失速的提前检测,对于预防喘振发生,降低发动机的运行安全隐患具有重大意义。确定学习是利用径向基函数神经网络对具有周期或回归轨迹的动态系统进行局部辨识的理论。利用该方法可以对压气机非线

学位

分布式自主群机器人协同围捕算法与实现研究

群机器人系统的研究是机器人学的一个新兴热点,它受启发于复杂的自然系统,如社会性昆虫（蚂蚁、蜜蜂等）和其它有集体协作的动物群体。群机器人系统的智能行为涌现自个体机器人之间实施的简单规则在集体层面的交互作用。作为群机器人系统一个十分典型的任务平台,群机器人围捕系统在军事任务、搜索营救、目标跟踪与监视、反恐任务和安全保卫等领域都具有十分重要的研究价值。然而目前群机器人围捕系统的理论尚不完备,所研究的围捕

学位

动态环境下基于深度语义联合估计的单目视觉定位算法研究

视觉定位技术因其仅需相机采集的视频序列就能实时解算相机位姿,在微创手术、增强现实以及自动驾驶等领域有着广泛的应用前景。然而多数视觉定位算法基于静态场景假设,动态物体会破坏相机与地图点的几何约束,导致相机定位丢失,这在安全领域十分致命。本文为了解决这一关键问题,利用深度学习网络预测的深度及语义信息,提出一种动态环境下的单目视觉定位算法。研究内容如下:1.用于单目视觉定位的深度预测与语义分割联合估计网

学位

基于信号时序逻辑的运行时验证技术研究

随着信息技术的迅速发展,软件系统的安全性和可靠性越来越受到重视,以测试、定理证明、模型检验等为代表的验证技术应运而生。运行时验证是一种轻量级的动态验证技术,通过目标系统高层规约来描述监控需求,生成相应的运行时监控器,分析和验证系统的运行轨迹是否满足监控规约。运行时验证技术首要的是寻求合适的形式化逻辑语言来准确描述目标系统的监控性质。针对监控规约一般由人为直接指定,或指定规约公式结构再优化其参数,可

学位

去甲肾上腺素单独或联合特利加压素治疗对脓毒症休克患者微循环及肠道功能的影响

目的探讨去甲肾上腺素单独或联合特利加压素在脓毒症休克治疗中的效果。方法以随机数字表法将2018年8月至2021年6月桂林市人民医院重症医学科收治的80例脓毒症休克患者予以分组，对照组40例，采用去甲肾上腺素治疗；观察组40例，采用去甲肾上腺素联合特利加压素治疗，记录两组患者维持治疗前、输注12、24和36 h时去甲肾上腺素剂量，观察两组维持治疗前、输注12、24和36 h时微循环及肠道功能变化

期刊

计算机辅助鼻咽癌预后系统的关键技术研究

鼻咽癌由于其较高的复发率,严重危害了人们的生命安全。临床研究表明,对鼻咽癌患者的合理预后,有助于制定更加完善且个性化的治疗方案,从而降低鼻咽癌的复发率和延长患者的生存时间。随着计算机技术和医学影像学技术的飞速发展,计算机辅助鼻咽癌预后系统已经逐渐成为研究热点之一,具有很高的临床应用价值。本文从三个方面对鼻咽癌进行预后:第一,基于改进图割（Grab Cut）算法的鼻咽癌区域分割并进行三维可视化,提供

学位

基于分布式观测器的非线性多智能体系统领导-跟随控制

近二十年来,多智能体系统的一致性问题一直是控制领域的热点问题,其主要分为无领导者一致性和领导-跟随一致性。在实际的领导-跟随控制中,往往不是所有跟随者都能获得领导者信息,分布式观测器是实现分布式一致性策略的一种有效方法。该方法将领导-跟随一致性问题解耦为估计领导者状态和设计控制器跟踪估计状态两部分,简化了多智能体系统的控制,且带来了更多的设计灵活性。目前关于分布式观测器的研究都是针对具有线性、已知

学位

基于环境感知的人机交互控制研究

随着工业4.0的到来和中国制造2025规划的颁布,制造业产品日趋复杂、多样,而且个性化需求日益突出,因此智能人机交互成为智能制造的重要内容。然而,目前传统人机隔离的生产方式制约了智能制造的进程。如何提高机器人的环境感知能力和人机交互能力,从而满足高端化、个性化、智能化的需求,成为智能制造面临的巨大瓶颈和挑战。首先,本文提出了一种基于位置的视觉伺服方法来执行双臂抓取和在线跟踪任务。该方法采用基于位置

学位

几类多智能体系统的迭代学习控制研究

与本文相关的学术论文