4×3博弈的连续虚拟行动的收敛问题

来源 :首都师范大学 | 被引量 : 0次 | 上传用户:qyqwoaini
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大多数关于虚拟行动过程的研究是关于FP是否收敛的问题。在《Cooperation:Game Theretic Approaches》书中,有一篇文章"Learning in Games:Fictitious Play Dynamics"(Krishna Vijay和Sjostrom Tomas),作者证明了“在满足策略互补(SC)和(DMR)条件下,每一连续虚拟行动(CFP)都收敛”。之后,作者又猜想“假设G(G=(A,B))满足策略互补,则每一CFP收敛”。结果[3]关于3×3博弈的证明验证了作者的猜想。至于3×4,4×4,……,n×n,m×n等博弈是否收敛,需要在进一步验证。 本论文的写作顺序是从博弈出发,首先介绍博弈有关知识,然后介绍虚拟行动,重点讨论4×3博弈的连续虚拟行动收敛问题,得出结论“满足策略互补性的非退化的4×3博弈的连续虚拟行动是收敛的”。最后将此结论推广到m×n博弈中。
其他文献
随着科学技术的发展和方程的研究,人们发现微分方程的很多结果可以直接应用到差分方程上去,但在某些结论上,微分方程与差分方程又有着本质的不同.这时,人们将目光放在了这样的问
本论文主要研究了时滞摄动切换系统的鲁棒控制问题。在系统运行中,由于元件老化、灵敏度不够、信息传输延时等原因,经常导致时滞现象的产生。时滞的出现时常导致稳定的系统不能
在图G=(V,E)中,用A(G)表示图G的邻接矩阵,则矩阵A(G)的特征值称为图G的特征值。所有图G的特征值组成的序列称为图G的谱,其中最大的特征值称为该图G的谱半径。一直以来,对于图的
种群系统的最优控制问题是控制论中一个十分活跃的研究领域,它丰富的理论和先进的方法为解决当今科技领域层出不穷的控制问题提供了卓有成效的工具,而且它还对种群的发展和控制