基于事件驱动控制的混杂动态博弈系统的纳什均衡分析

来源 :控制理论与应用 | 被引量 : 0次 | 上传用户:jinn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文研究了基于事件驱动控制的混杂动态博弈系统的纳什均衡分析问题.首先,分析了事件驱动机制对混杂动态博弈过程的影响,进而,在进行状态空间描述的基础上,给出了混杂动态博弈的纳什均衡的定义,并建立了对应博弈系统的策略型模型.其次,结合Lanchester方程,分别讨论了两类混杂动态博弈系统的均衡问题,包括事件驱动策略设计和固定的情况,获得了均衡解存在的必要条件.最后,通过数值模拟进行了应用分析,验证了所取得结果的合理性和科学性,并总结了混杂动态博弈研究的未来工作.
其他文献
本文研究了一类具有不确定非线性动力学和未知外部扰动的二阶非线性系统的全局有限时间输出镇定问题.首先,提出了一种全局状态反馈有限时间控制器,实现了二阶非线性系统的有限时间镇定.为了解决只有系统输出可用这种更有挑战性的情况,采用了一种新颖的设计思想,即非分离原理.构造了一个有限时间收敛的状态观测器来估计未知状态.在此观测器的基础上,提出了一种基于输出的有限时间复合控制器.基于李雅普诺夫方法,证明了整个闭环系统的全局有限时间稳定性.仿真结果表明了理论的有效性.
针对一类具有任意相对阶且带有部分非输入到状态稳定逆动态的非线性切换系统,提出一种动态事件触发漏斗跟踪控制方案.首先,引入一个虚拟输出将任意相对阶的非线性切换系统转换为相对阶为一的非线性切换系统.其次,设计各子系统的事件触发漏斗控制器和切换的动态事件触发机制,解决候选事件触发漏斗控制器和子系统之间的异步切换问题,所提方案消除已有文献中为所有子系统设计共同控制器带来的保守性.在一类具有平均驻留时间切换信号的作用下,保证切换闭环系统的所有信号都是有界的,且跟踪误差一直在预设的漏斗内演化,并排除采样中的奇诺现象.
具有可数状态空间的马尔可夫决策过程(Markov decision process,MDP)在平均准则下,最优(平稳)策略不一定存在.本文研究平均准则可数状态MDP中满足最优不等式的最优策略.不同于消去折扣(因子)方法,利用离散的Dynkin公式推导本文的主要结果.首先给出遍历马氏链的泊松方程和两个零常返马氏链的例子,证明了满足两个方向相反的最优不等式的最优策略存在性.其次,通过两个比较引理和性能差分公式,证明了正常返链和多链最优策略的存在性,并进一步推广到其他情形.特别地,本文通过几个应用举例,说明平均
本文提出了一种基于主动学习的增强模型预测控制方法.该方案克服了大多数基于学习的方法的缺点,即只能被动地利用可获得的系统数据并导致学习缓慢.首先应用高斯过程来评估残差模型的不确定性并构建多步预测模型.然后提出了一个两阶段主动学习策略,通过在优化问题中引入信息增益作为对偶目标来激励系统探测.最后,基于鲁棒不变集定义了安全控制输入集保证了状态约束满足与系统安全性.本文提出的方法在保证系统安全的情况下提高了学习能力和闭环控制性能,实验说明了本文方案的优越性.“,”This paper proposes an ac
量子神经网络结合了量子计算与经典神经网络模型的各自优势,为人工智能领域的未来发展提供了一种全新的思路.本文提出一种基于参数化量子电路的量子卷积神经网络模型,能够针对欧几里得结构数据与非欧几里得结构数据,利用量子系统的计算优势加速经典机器学习任务.在MNIST数据集上的数值仿真结果表明,该模型具有较强的学习能力和良好的泛化性能.
在给定一个子集的条件下,本文研究了在状态翻转控制下布尔控制网络的全局镇定问题.对于节点集的给定子集,状态翻转控制可以将某些节点的值从1(或0)变成0(或1).将翻转控制作为控制之一,本文研究了状态翻转控制下的布尔控制网络.将控制输入和状态翻转控制结合,提出了联合控制对和状态翻转转移矩阵的概念.接着给出了状态翻转控制下布尔控制网络全局稳定的充要条件.镇定核是最小基数的翻转集合,本文提出了一种寻找镇定核的算法.利用可达集的概念,给出了一种判断全局镇定和寻找联合控制对序列的方法.此外,如果系统是一个大型网络,则
对于通讯信道具有丢包的网络化反馈控制系统,运用乘性噪声模型来描述丢包这一信道不确定性,并根据网络化系统的结构特点提出了一种渐近跟踪控制器结构,研究了该结构下系统的均方可镇定性以及均方最优渐近跟踪与均方可镇定性的等价关系.在此基础上,运用随机均方最优控制理论给出了该系统均方最优渐近跟踪设计方法,该方法取决于广义代数黎卡提方程(MARE)的均方镇定解.进一步,本文提出了求解上述均方镇定解的新算法.最后的仿真验证了对于信道具有丢包的网络化反馈系统最优渐近跟踪问题,本文所提方法的有效性和可行性.
切换布尔网络是一种典型的网络化控制系统,在基因调控、信息安全、人工智能、电路设计等领域具有重要应用.本文基于牵制控制方法,研究切换布尔网络在任意切换下的分布式集合镇定问题.首先,利用矩阵半张量积方法,得到切换布尔网络的代数形式.其次,基于代数形式,提出构造性的算法来实现切换布尔网络在牵制控制的作用下任意切换集合镇定,并设计出状态反馈牵制控制器.再次,利用逻辑矩阵分解技术和分布式控制方法,设计任意切换下切换布尔网络的分布式集合镇定控制器,并提出分布式控制器存在的充分条件.文中给出3个例子来说明所获得结果的有
量子神经网络由于结合了量子计算和神经网络的优点,近年来受到了广泛的关注.然而由于目前量子计算资源受限(如量子比特数、量子逻辑门的保真度等)以及贫瘠高原现象(量子神经网络优化过程中解空间变得平坦时出现的训练困难)的存在,量子神经网络当前还难以大规模训练.针对上述问题,本文面向量子–经典混合神经网络模型提出了一种基于无监督学习的特征提取方法.所采用的无监督学习方法结合了量子自编码器和K-medoids聚类方法,可用于多层次结构的特征学习.该方法创新地利用了K-mediods方法对训练得到的量子自编码器进行聚类
本文研究了干扰影响下演化博弈的稳定与镇定问题.首先,文章给出了干扰博弈、控制–干扰博弈以及鲁棒Nash均衡等概念,并在此基础上提出了干扰演化博弈与控制–干扰演化博弈鲁棒稳定与镇定的定义.其次,利用矩阵半张量积工具,得到了干扰演化博弈与控制–干扰演化博弈的代数状态空间表示,将鲁棒稳定与镇定问题转化为一个辅助系统的集合稳定与集合镇定问题.紧接着,文章建立了干扰演化博弈与控制–干扰演化博弈鲁棒稳定与镇定的充分必要条件,并进一步设计了状态反馈控制器.最后,通过两个例子验证了所得结论的有效性.