论文部分内容阅读
在本研究中,我们探究了重复正则博弈中的信念学习问题。我们将经典模型中限定“信念是策略空间中的一个点”这一假设去除,允许参与者的信念集合是策略空间的连通闭子集,并且相应地把期望效用函数也拓展到非期望效用函数,推广了原有描述正则博弈中的参与者行为的模型。在我们的模型下,极小极大策略在存在模糊性的条件下可以成为严格最优反应。随后我们将模型应用到重复60回合的常和博弈中,在实验室邀请120名参与者进行了8场实验,我们通过设计激励相容的奖励规则使得参与者在每回合报告自己的信念。实验共分两组:基本组实验中,参与者只能选择纯策略,每个回合结束只会被告知对手所选择的行动;混合策略组中,参与者可以选择混合策略,每个回合结束时他们会被同时告知对手所选择的策略以及依据该策略随机实现的行动。通过这样的实验设计,我们可以验证参与者是如何在对手的策略和实现的行动中进行取舍形成信念。本文的贡献主要有三点,首先,通过模型的拓展证明了极小极大策略在模糊性存在的情况下能够成为严格最优反应,这从理论和实验两个方面解决了以往文献的发现与经典理论之间的冲突;其次,实验数据表明实验参与者的先验集合确实不是文献中所假设的单点集,并且通过对信念序列的研究,我们发现实验参与者在形成信念时是复杂且精细的:他们会充分利用更多的信息(对手选择的策略)来形成信念。最后,通过研究信念与信心的动态过程展现,我们从实验数据验证了模型的均衡状态。对于大部分参与者,他们的先验集合会收敛到一个稳定状态。