基于广义扩展状态观测器的多智能体系统纳什均衡搜索

来源 :华北电力大学(北京) | 被引量 : 0次 | 上传用户:andymei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
博弈论作为一种重要的分析工具被广泛应用到了金融学、生物学、计算机科学、人工智能等众多领域。根据玩家间是否能达成具有约束力的协议,博弈可以分为合作博弈以及非合作博弈。近年来,非合作博弈在移动传感器网络设计、智能电网、无人驾驶等众多问题上得到了广泛研究。非合作博弈的本质在于决策与优化。一个非合作博弈问题主要包括以下三个重要的元素:玩家、玩家策略以及代价函数。在非合作博弈中,玩家根据代价函数改变自己的策略,最终达到纳什均衡。在纳什均衡下,任何玩家都不能通过单方面改变决策的方式达到降低其代价函数的目的。本文将在非合作博弈的理论框架下,将智能体与参与博弈的玩家相联系,从而非合作博弈被描述为由有限数量的智能体参与的优化问题。然而在实际的工业环境中,存在着许多的环境噪声以及未知干扰可能会使得系统难以收敛于纳什均衡。考虑多智能体系统中在实际环境中可能会受到的噪声,本文主要研究了受到未知模型的干扰的多智能体系统的纳什均衡搜索问题,主要工作如下所示:(1)在非合作博弈的框架下,智能体通过改变控制输入改变自身策略状态。然而在实际工业环境中,不可避免地存在噪声与干扰,并且这些噪声与干扰的模型往往是未知的。这对于智能体策略状态的更新有很大影响,从而使其难以甚至于无法收敛到纳什均衡。针对该问题,在智能体动态为一般线性系统的非合作博弈问题中,通过将外部扰动视为扩展状态,设计了一种广义扩展状态观测器来观测并抑制扰动。基于所设计观测器,根据智能体间通信情况,即针对完全信息和不完全信息两种情况,分别设计了基于代价函数梯度的集中式和分布式纳什均衡搜索算法。在分布式纳什均衡搜索算法下,智能体通过邻居通信,利用一致性协议种来估计所有智能体策略的聚合变量。最后,证明了在所设计的算法的驱动下,各个智能体将会收敛到纳什均衡点的一个邻域。(2)考虑未知模型的扰动是通过与控制输入不同的通道进入系统的情况,即系统所受到扰动为不匹配扰动的情况。论文针对受到上述干扰的双积分器系统的聚合博弈问题,设计了一种基于广义扩展状态观测器的纳什均衡搜索算法,并利用李雅普诺夫稳定性理论以及无源性理论,证明了所设计算法的收敛性。在所设计的算法驱动下,智能体最终可以收敛到纳什均衡点的一个邻域。
其他文献
综合能源系统内部包含电、冷、热、气等多种不同形式的能源,能打通不同形式能源流动的交互渠道,实现对不同形式能源的统一调度、梯级利用。负荷预测是综合能源系统稳定运行,调度能源的基础,具有重要研究意义。本文利用综合能源系统不同负荷之间的关联性,提出一种基于迁移学习的综合能源系统负荷预测方法。为了分析综合能源系统中负荷与负荷之间、负荷与影响因素之间的关联性,使用Copula函数对它们的关联性进行量化,为后
学位
作为一种新型需求侧响应装置,电力弹簧为解决大规模可再生能源并网带来的系统电压波动问题提供了新的技术途径,可有效缓解因网侧电压不稳定而引发的关键负载电压波动。目前,应用于电力弹簧系统的控制多为传统线性控制方法,但对于电力弹簧这种非线性系统,尤其是多电力弹簧协同运行时,传统线性控制存在着系统失稳的风险。无源性控制是本质稳定的非线性控制方法,它可以保证系统在全运行域内可靠稳定的运行。本文的主要研究内容便
学位
大规模新能源发电趋势不可逆转,分布式发电将成为未来电力供应主要方式。电能路由器可高度融合电气和通信信息,实现分布式能源的高效管理。家庭用户接入屋顶光伏和小型风机等新能源,通过电能路由器的功率控制方法可提高用电质量并带来经济效益,未来家用电能路由器有望走进千家万户。本文主要对电能路由器的设计及其功率控制方法进行了研究,主要包含以下几个方面:首先,提出电能路由器基本功能要求,逐一设计各个模块,包括交直
学位
我国是全球地震活动性最强的国家之一,地震易发区面临着各种潜在的地震地质灾害,其中滑坡作为最大的次生灾害问题,所导致的受灾规模呈现逐年增加的趋势,因此地震边坡致灾机理的研究一直是岩土地震工程领域重要的课题之一,而对于地震下滑坡危险性的分析与量化,也成为现今区域场地防震减灾和规划工作亟待解决的现实问题。但由于地震下边坡动力失稳问题的复杂性,对其内在的机理性认识仍远远落后于实践需求。且地震发生时,主震后
学位
随着“碳中和”目标的提出,在役火电机组将更加频繁地承担调峰任务以满足大规模可再生能源并网带来的挑战,快速和深度的负荷变化对超(超)临界机组运行可靠性与稳定性提出了更高的要求。机组跨临界区受热面汽水侧传热、流动和颗粒沉积规律复杂且处于高温高压环境,实验参数获取和控制都十分困难,在此领域的研究尚处于单一学科方向的探索。因此理解和掌握含铁颗粒物在跨临界区的流动和沉积规律,是进一步提高机组运行安全性和可靠
学位
伴随着我国经济的快速发展以及人们生活水平不断提高,能源消费也随之增高,伴随着化石能源燃烧所释放的二氧化碳已经超出了地球的承载能力。我国已明确提出2030碳达峰和2060碳中和的“双碳”发展战略目标,如何科学合理在降碳的同时,优化能源消费结构,从而保障经济社会可持续化发展是亟待解决的问题。能源足迹可以用来衡量一个地区生产生活中的能源消耗给环境所带来的压力,可以量化碳排放和碳吸收之间的差异,适合用于衡
学位
我国煤资源丰富,煤种多样,燃煤电厂出于实际运行条件及经济性考虑,不得不燃用各种煤质的非设计煤种,其中不乏低热值、高硫含量的煤种。当燃用煤种煤质参数与设计煤种相差较大时,很容易造成炉内燃烧问题,特别是燃烧高硫含量煤种时,若水冷壁近壁面出现超温或是还原性气氛,极易造成结渣和水冷壁高温腐蚀,严重危害锅炉的运行安全,造成巨大的损失。为研究火电机组实际运行时燃烧非设计煤种对炉内燃烧特性,以及锅炉水冷壁高温腐
学位
基于视频分析与监控的管理模式常应用于无人值守变电站,它能及时发现设备故障,不但减少了巡检人员的工作强度并提高效率,同时也提升了变电站设备安全稳定运行的可靠性。变电站设备运行状态通常通过主控室内指示灯的颜色及亮、灭、闪烁状态来反映,然而现有视频监控系统中常常依靠人工辨别指示灯信息,预警功能未得到高效利用,存在漏检误检、标准不一致等问题。研究基于视频的变电站设备指示灯状态智能识别技术,可及时根据指示灯
学位
以HPR1000,AP1000和CAP1400为代表的大型先进压水堆相较传统Ⅱ/Ⅱ+堆型在大幅提高了经济性的同时,采用了大量的特有安全设计,其中之一便是在发生堆芯熔毁严重事故时通过向压力容器(Reactor Pressure Vessel,RPV)外堆坑注水淹没并冷却下封头,实现熔融物堆内滞留(In-vessel Retention,IVR),即压力容器外部冷却(External Reactor
学位
近年来,可积的非线性偏微分方程成为非线性科学的重点研究内容,这些方程常用来描述诸多领域如生物学、数学、物理学等中的非线性现象。导数非线性薛定谔(DNLS)方程因其可以模拟等离子体中的阿尔文波、光纤中的飞秒脉冲和电解质中的弱非线性电磁波现象而备受关注。本文致力于研究第三类DNLS方程——GI方程的高阶代数孤子解及其孤子的相互作用动力学性质。首先,利用达布变换方法得到了 GI方程的N阶指数型孤子解,并
学位