论文部分内容阅读
文章在分析国内外研究成果的基础上,引入收益函数r(i,j)和持续时间函数τ(i,j)对重复博弈的模型Γ(r,τ)进行论述,并结合不确定决策分析方法和算例对重复博弈的响应策略进行了分析。探讨了在未知局中人P_2策略的情况下P_1的最佳响应策略。结果表明,局中人P_1的行动策略X对P_2的行动策略Y的最佳响应策略为X~*(y)=argmaxρ(x,y)。