基于代数状态空间方法的有限博弈的分析与设计

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:khsim
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着博弈与控制交叉学科的兴起,博弈论受到了控制领域的广泛关注。基于博弈方法的控制论在多智能体的协同控制、武器分配、电力系统的经济调度等方面得到了广泛应用。然而,利用博弈理论解决控制问题的前提是对博弈系统性质的深入了解,因此对有限博弈的结构性质与演化动态的分析是很有必要的。本文主要以矩阵的半张量积为工具,基于代数状态空间方法,研究有限博弈正交分解、博弈设计、演化动态以及在武器-目标分配问题上的应用。
  首先,研究了调和博弈的动态等价性及有限博弈的正交分解。通过推导得到了与基底纯调和博弈动态等价的纯调和博弈的充要条件;针对有限博弈的向量空间结构,分别从对称博弈、零和博弈以及正规化博弈的角度出发,提出了基于对称博弈、基于零和博弈以及基于正规化博弈的三种有限博弈的正交分解方法,并分别推导出了不同博弈子空间的基底;比较分析了向量内积在不同博弈正交分解中的作用,证明了只有当相容性条件满足时,不同的正交分解均可在标准内积下实现。
  其次,研究了三种不同类型势博弈的检验与设计问题。针对网络上的分布式博弈问题,提出了基于局部信息的势博弈设计方法,给出了设计只依赖于局部信息收益函数的充要条件;针对网络上具有竞争性质的势博弈,推导得到了检验与设计零和势博弈的充要条件;针对网络上的群体博弈问题,推导得到了检验群势博弈的充要条件,提出了设计群体收益函数的方法。
  然后,研究了状态演化博弈学习规则的设计问题。提出了基于两步记忆的非耦合较优响应学习规则,证明了该学习规则在可达条件下能够几乎必然地收敛到状态演化博弈的常返状态平衡;证明了不存在能够收敛到一般状态演化博弈常返状态平衡的多项式时间算法;借助于设计的学习规则,实现了有限博弈纯纳什均衡的求解和时变拓扑下多智能体的一致性。
  接着,研究了两类超图演化势博弈的检验与动态特性。针对超图群势博弈,推导了超图上的基本网络博弈为群势博弈的充分条件;证明了在群级联短视最优更新规则下,超图演化群势博弈能够收敛到其纳什均衡。针对策略区分博弈,设计了策略区分逻辑响应学习规则,证明了它的收敛性;证明了当基本网络博弈为二人对称协调博弈时,网络演化策略区分势博弈在策略区分逻辑响应学习规则下,其随机稳定状态是由个体风险占优策略组成的局势。
  最后,研究了武器-目标分配问题的博弈方法。建立了武器-目标分配问题的博弈模型;针对网络图联通的通信结构,提出了基于局部信息势博弈的武器-目标分配方法,并通过仿真对比了短视最优响应与逻辑响应两种规则对收敛速度的影响;针对通信中断的情况,提出了一种基于群势博弈设计的武器-目标分配问题求解方法,仿真对比说明群势博弈设计方法能够以较快速度收敛到次优分配;针对切换通信结构,提出了一种基于状态博弈两步较优响应学习规则的求解方法,实现了最优分配求解,仿真验证了该方法的有效性。
其他文献
本文研究了O/CO气氛下煤粉燃烧特性、SO钙基脱除的直接硫化特性及NOx燃煤排放特性,并对燃烧过程进行了数值模拟,主要工作概括为以下六个方面:1.借用热重分析手段比较了空气和O/CO气氛下煤粉的燃烧特性,并就固硫特性作初步讨论.通过对莱阳煤、长广煤、太平煤三种煤种的着火温度、燃尽温度、及燃烧特性指数的分析,表明O/CO气氛下的燃烧优于空气,并从反应动力学数据得到证实.同时,借助定硫仪初步比较了煤粉
学位
目的介绍腹腔镜技术在小儿整形泌尿外科的应用经验。材料与方法2005年4月至2008年4月共完成小儿腹腔镜重建性泌尿外科手术17例,包括重复肾重复输尿管1例,肾盂输尿管连接部狭窄11例,输尿管膀胱连接部梗阻2例,输尿管结石3例。其中男性12例,女性5例,平均年龄11岁。均采用
目的介绍后腹腔镜离断性肾盂成形术的技术改进及其临床效果。材料与方法2007年4月至2008年4月共完成后腹腔镜离断性成形术15例。其中男性10例,女性5例,平均年龄35岁。手术方法:采用经后腹腔途径三孔法。均采用后腹腔途径,按常规制备后腹腔操作空间和"三孔法"放置trocar。纵形切开Gerota
目的介绍后腹腔镜手术治疗巨大肾上腺肿瘤的经验。材料与方法2003年4月至2008年4月共完成后腹腔镜巨大肾上腺切除手术18例(直径大于6cm,其中最大径者为12cm)。其中男性10例,女性8例。手术方法:采用经后腹腔途径三孔法。在成功建立后腹腔操作空间后,尽量贴近腹膜返折边缘与膈肌附近纵形切开肾周筋膜以获得最大操作空间,从而有利于充分显露肿瘤。分别在前肾周筋
随着大规模可再生能源的开发和应用,电网变得愈加庞杂,如何保证大量不同控制器之间的协调是最令人关注的问题之一。微分博弈理论是求解多目标协调控制问题的崭新思路。为了降低求解难度,现有研究建立的微分博弈模型几乎都是线性的。然而,在实际运行过程中,电力系统存在着人为加入的约束或系统自身固有的物理约束,系统必定是一个非线性系统,线性模型所得的控制策略未必能保证系统的安全稳定运行。因此,如何对非线性微分博弈问
学位
本文首先从S2气体放电激光器的物理特性出发,全面微观地描述了气体放电过程,研究了放电激励产生S2分子激光的基本理论:S2分子粒子数密度的确定、电子碰撞激发速率、S2分子的电子碰撞激发截面。描述了完成一次脉冲快放电泵浦的动力学过程。在物理分析的基础上,建立了激光器放电过程的第二阶段—激光器两端电压迅速下降过程的计算模型和电路模型。在计算模型的基础上,分别建立了放电瞬间等效电阻和等效电感的子电路模
学位
目的报告解剖性后腹腔镜肾上腺切除术的40例手术经验。材料与方法2007年7月至2008年5月共行解剖性后腹腔镜肾上腺切除术40例,其中肾上腺部分切除术30例,肾上腺完全切除10例。术前诊断为库欣综合5例,原醛12例,嗜铬细胞瘤5例,肾上腺增生2例,肾上腺囊肿10例,无功能腺瘤5例,髓性脂
转炉冶炼终渣TFe含量,直接影响到钢铁料消耗、钢水收得率、钢水纯净度、溅渣护炉效果等多项经济技术指标,本文主要介绍了宁波钢铁降低转炉冶炼终渣TFe的工艺研究情况,通过技术攻关及工艺优化,转炉终渣TFe明显降低,取得了良好的冶金效果。
多输入多输出(Multiple input multiple output, MIMO)雷达是一种新体制雷达,相比于传统相控阵雷达具有非常多的优势,对其技术的研究为雷达系统发展提供了新的机遇。双基地MIMO雷达结合MIMO雷达和双基地雷达布阵方式的优点,成为当前MIMO雷达的热点研究方向。本文结合张量分解及空域滤波技术,主要研究双基地MIMO雷达多目标波离方向(Directional of dep
社会情境中正确理解他人的意图有助于人际互动和社会适应。过去十年来,关于意图理解认知神经机制的研究很多,但是直接将私人与社会性(交际)的运动意图的认知神经机制相对比的研究比较少。为了探究该问题,本研究记录了16名健康被试完成三种不同的意图理解任务时的脑电反应。三种实验任务分别为:1)理解以自我为导向的私人意图;2)理解以他人为导向的交际意图;3)理解以物体为导向的物理意图。神经电生理学结果表明在大脑