基于零行列式策略的网络博弈理论与人机博弈实验研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户：zhangshuai824

【摘要】

：

合作在当今社会中扮演着越来越重要的角色,小到生物体内细胞间的分工协作,大到学校企业各部门的职能搭配,甚至国家与国家之间的外交与贸易,都与合作密不可分。研究合作行为不

【作者】

：

许雄锐

【出处】

：

电子科技大学

【发表日期】

：

2019年01期

【关键词】

：

复杂网络演化博弈零行列式策略人机博弈

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

合作在当今社会中扮演着越来越重要的角色,小到生物体内细胞间的分工协作,大到学校企业各部门的职能搭配,甚至国家与国家之间的外交与贸易,都与合作密不可分。研究合作行为不仅可以帮助我们更好地理解复杂系统中的繁杂现象,构建和谐有序的社会环境,而且有助于促进多智能体间的协同运作,提升系统的整体性能。博弈论为研究竞争环境下的合作提供了统一的理论框架。传统博弈理论认为博弈各方的收益需由所有参与者共同决定,然而近年提出的零行列式策略可以在重复囚徒困境博弈中单方面限定博弈双方的期望收益关系,为博弈论研究提供了崭新的视角。敲诈策略和慷慨策略是两类重要的零行列式策略子集:敲诈策略可以单方面保证自己的收益不低于对手,而慷慨策略是敲诈策略的对偶策略,可以单方面保证自己的收益不高于对手。这两类策略引起了学者们的特别关注。现实中的许多复杂系统,如生物系统、社会系统和互联网等都可以用复杂网络进行刻画。网络演化博弈理论结合复杂网络和演化博弈理论,致力于研究在复杂场景下多个体间的博弈及演化动力学,为理解真实系统中的群体合作行为提供了理论工具。除了理论研究以外,真人博弈实验是博弈论的另一重要研究范式。通过开展实验,一方面可以对博弈理论进行验证,另一方面也可以挖掘个体的真实行为规律,为理论研究提供支持。本文基于零行列式策略理论,分别从网络演化博弈理论和人机博弈实验两个方面,对群体的合作演化机理与个体的博弈行为特性展开研究。主要包括以下内容:首先,本文研究了敲诈策略在规则网络上的演化轨迹以及其对合作演化的影响。在重复囚徒困境博弈模型和复制动力学更新机制下,本文通过数值仿真和点对近似模拟研究了合作、背叛与敲诈策略在规则网络上的博弈与演化。结果表明敲诈策略在规则网络上可以与合作策略形成稳定的联盟结构,从而抵御背叛策略的入侵,并最终消灭背叛策略,极大地促进合作的涌现。接着,本文基于费米函数规则研究发现,个体有限理性程度对敲诈策略与合作策略的演化存在非单调的作用。规则网络是经典的网络模型,该研究有助于为更复杂结构上的网络博弈研究提供基准,具有重要的理论价值。其次,本文基于重复囚徒困境模型与复制动力学更新机制,研究了敲诈策略在无标度网络上的演化。首先通过数值仿真研究了无标度网络上合作、背叛和敲诈策略的博弈与演化,发现敲诈策略可以帮助合作策略在网络上从小度叶子节点扩散到大度中心节点,形成一种“自底向上”的扩散路径。随后进一步研究了网络度相关性对演化的影响,发现在拥有同配特性的无标度网络上,敲诈策略可以促进不同策略在网络中的重新分配,帮助合作策略占据大度节点,并避免被背叛策略入侵。但网络的同配特性反过来也抑制了合作策略的进一步扩散。已有研究表明,满足幂律度分布的无标度网络模型能有效刻画真实系统的拓扑结构特性,该研究为理解真实网络上的合作涌现提供了新的思路。再次,本文研究了引入博弈交互与策略学习之间的时间尺度多样性之后,敲诈策略在网络上的演化。在模仿动力学机制下,网络演化博弈中存在两层网络:博弈交互网络与策略学习网络。过去网络博弈研究通常假设这两层网络拥有一致的时间尺度,然而在现实中这者并非总是一致的。本文通过引入一个多样性因子对这种不一致性进行量化,发现在规则网络上加入一定的时间尺度多样性,可以帮助博弈个体在获得高收益之后降低更新速率,从而有效地促进了合作策略与敲诈策略形成稳定的联盟结构,提高了整体的收益。虽然在无标度网络上敲诈策略无法与合作策略稳定共存,但引入时间尺度多样性同样可以促进合作策略与敲诈策略的接触,帮助合作行为在网络中扩散,从而提升网络中的合作比例。该结论有助于进一步理解真实场景下的策略演化机制。最后,本文通过开展基于零行列式策略的人机博弈实验,对个体行为特性进行实证研究。通过控制被试与不同零行列式策略博弈以及告知被试其博弈对手的不同性质这两个重要变量,研究了人类被试在博弈实验中的合作行为。结果表明,不同零行列式策略对被试的合作行为存在不同的影响,并且告知被试其对手的不同性质可以调节这两种影响的差异程度。特别地,明确告知被试其对手为计算机程序,一方面可以有效地消除敲诈策略对合作行为的抑制作用,另一方面也会减弱慷慨策略对合作行为的促进作用。此外,本文进一步研究了人类被试的决策时间特性。结果表明,在重复博弈实验中人类的决策时间存在明显的异质性,其频率分布具有长尾现象,尾部可以由幂律分布近似拟合。这些结论为研究个体的合作规律以及与决策时间相关的行为分析提供了重要的参考。

其他文献

猕猴间充质干细胞联合非清髓单倍体造血干细胞移植的实验研究

单倍体造血干细胞移植因为要跨越MHC屏障,存在移植物抗宿主病(GVHD)重、植入困难、致命性感染发生率高等问题,文献报道非清髓性造血干细胞移植(NST)可通过形成供受者混合嵌合

学位

猕猴间充质干细胞非清髓单倍体造血干细胞移植

火灾报警系统的软硬件研究与设计

火灾自动报警系统是一项很有社会意义的安全项目,包涵了众多的设备选型,与软硬件连接.本文对火灾探测系统的组成,设计进行了分析总结,对相关软硬件进行了研究与设计,给出了实

期刊

火灾报警系统硬件选型连接方式软件设计

“排除合理怀疑”的理解和适用研究

“排除合理怀疑”是我国刑事诉讼的证明标准,区分罪与非罪,对其正确的理解和适用关系着刑事诉讼打击犯罪与保障人权动态平衡的目的能否真正实现。然而,在我国刑事诉讼司法实

学位

证明标准排除合理怀疑证据确实充分独适说统一

红河州耕地土壤肥力现状及分布

红河州耕地土壤养分含量差异较大，养分平均值含量虽高，但含量低的土壤所占比重较大。土壤养分不平衡问题较突出，土壤缺硼较普遍。通过对红河州高、中、低产田地类型的划分及分布

期刊

耕地土壤肥力现状分布云南红河州

棋茶馆

棋与茶自古以来就有难解难分之缘分。在与棋手对弈之际,有清茶一杯在手,边喝茶,边思考,既可生津止渴,又可提神静心思谋策略,真是“一盏清茗伴棋局”。而品茗之时,与棋友摆上

期刊

棋茶馆上层人士平民百姓

基于主、被动混合模式的柔性薄板振动抑制的策略研究

薄板结构因其结构简单、重量轻等特点被广泛应用在各种领域中。薄板结构自身具有较高柔性,在实际工程应用中易产生较大振动,进而导致工作精度减低或疲劳损失等不良影响。采用

学位

矩形板振动抑制阻尼片压电片主、被动混合模式

荞麦饼干品质改良工艺优化及品质分析

以荞麦粉和低筋面粉为主要原料,添加竹笋膳食纤维和大豆分离蛋白对荞麦饼干进行品质改良工艺优化,并对产品进行品质评价及分析。结果表明,荞麦饼干的最佳配方为:低筋面粉与荞

期刊

荞麦膳食纤维大豆分离蛋白品质改良

“一带一路”背景下西安博物馆、美术馆文创产品创新研究

在“一带一路”背景下西安市的博物馆、美术馆应积极发掘自身文化资源、研发文创产品,将西安的城市历史文化资源进行串联、梳理,以此促进传统文化资源的创造性转化、增强其自

期刊

文创产业传统文化文化资源文创研发

脂质运载蛋白-2在川崎病相关心肌损伤和肺动脉重构中的作用及机制研究

川崎病(Kawasaki Disease,KD)是一种儿童期较常见的发热、出疹性疾病,主要病理特征是全身中小血管炎症。近年来,该病的发病率呈逐年上升趋势,成为目前儿童后天性心脏病的首位

学位

川崎病相关心功能损伤和肺血管重构脂质运载蛋白-2内质网应激

最初的选择,最终的守护——评《通往未来的门》

《通往未来的门》是凯特·汤普森继《寻找时间的人》之后又一部有关成长主题的作品。作者融爱尔兰传统神话元素与现代生活于一体的叙事手法,打破了时间的线性发展,在过去、现

期刊

魔幻与现实过去与未来对抗成长与抉择人性观

基于零行列式策略的网络博弈理论与人机博弈实验研究

与本文相关的学术论文