基于雪堆博弈的零行列式策略研究

来源 :电子科技大学 | 被引量 : 1次 | 上传用户:TIANYAGUKEXING
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
过去半个多世纪中,博弈论作为探索个体间相互作用的有效工具,在多个领域均有广泛的应用。在2012年学者基于囚徒困境模型研究发现,存在一种称为零行列式的策略可以单方面控制双方长期收益达到线性关系。与囚徒困境不同,雪堆博弈作为博弈论中一种经典模型,其中存在两种纯纳什均衡,所以合作更容易在雪堆博弈中存在。因此,雪堆博弈无论是在理论研究还是在现实应用中,都有着极高的研究价值。本文基于零行列式理论,系统研究了两人以及多人和行为空间连续的雪堆博弈中的零行列式策略,取得如下研究成果:1)基于两人雪堆博弈,分别研究了设定策略、剥削策略和宽容策略的性质。证明了在两人雪堆博弈模型下,零行列式策略的存在性及其参数可行域。并对两人雪堆博弈下的善良策略和鲁棒策略进行了研究,其中善良策略是将零行列式策略中的Press-Dyson向量扩展到三维空间后的一种特殊策略,而鲁棒策略则属于善良策略的一类子策略,得到了善良策略在雪堆博弈下的判断方法,以及具有鲁棒性的零行列式策略存在的条件。2)将两人雪堆博弈扩展到了多人和行为空间连续的情况。研究了多人雪堆博弈下的零行列式策略的基本性质,以及三类重要子策略存在时,参数可行域与种群大小和收益表参数之间的关系。将零行列式策略定义扩展成高阶微分形式后,证明了连续雪堆博弈下存在零行列式策略,并得到了三类子策略的参数可行域。3)将本文的研究结果与囚徒困境下已有的零行列式策略的研究进行了系统对比。发现无论是在两人、多人还是连续的雪堆博弈中,与对应的囚徒困境博弈模型相比,在雪堆博弈模型下,使用剥削策略时参数可行域更小,不存在太过贪心的剥削策略。解释了在对合作行为更加友好的雪堆博弈中,尽管善良策略能够促进合作行为的演化,参数的可行域与囚徒困境模型相比反而减小的原因。
其他文献
随着英特网的爆炸性增长,网络系统必须在满足不断增长的网络链接速度的同时,能够灵活的应对网络的不断演化。对速度和灵活性的双重需求催生了新一代的网络硬件——网络处理器
流媒体技术作为一种新的网络媒体传输方式,很好的解决了视频数据在互联网上的传输问题,并越来越广泛地应用到视频点播系统中。流媒体视频点播技术的出现,在某种意义上说是视
在面向服务的系统架构中,单个web服务的有限功能已无法满足用户日益复杂的业务功能需求,从而催生了组合已有的简单服务来构建满足用户复杂需求的增值服务的方式,即服务组合。
长期以来,人们一直希望运输工具和机器自身能实现自主导航。从早期的科幻小说到2003年6月奔赴火星的“勇气号”,再到近来兴起的智能化高速交通系统,自主移动智能机器人系统已成
模糊现象是客观世界普遍存在的现象,也是经典数学难以用数学模型描述的问题。从上世纪60年代由Zadeh创始而被发展起来的模糊集理论,标志着数学研究对象由精确性量性对象到模糊
随着计算机及Internet的发展,远程教育越来越受到人们的青睐。作为远程教育平台中不可缺少的组成部分,答疑系统对提高教学质量起着至关重要的作用。智能答疑系统是当前自然语言
随着着高校信息化建设的快速发展,跨部门应用集成与独立异构系统之间的矛盾日益突出,建立一个能够集成现有异构应用系统且灵活兼容新系统的数字化校园服务集成平台的需求越来
多智能体系统(Multi-Agent System,MAS)体系结构及协作机制是多智能体理论研究的核心与热点问题,作为一种新兴的研究方法,基于协进化机制的多智能体协作具有广阔的研究前景。论
说话人识别技术作为生物认证技术的一种,是根据语音波形中反映说话人生理和行为特征的语音参数自动鉴别说话人身份的一项技术。说话人识别技术以其独特的方便性、经济性和准确
近年来,流媒体正在成为推动未来宽带应用的主动力。而流媒体典型应用中的流媒体直播技术凭借其不用下载等待,实时性好等特点,在VOD、远程教学等网络多媒体中得到广泛应用。流媒