论文部分内容阅读
刘瑞钰 张津硕 通讯作者
摘要:本文基于博弈论的理论,通过静态博弈、动态博弈两种手段,分析了不具有监管情形、具有惩罚情形情形下的博弈情况,来更好的探究在考试过程中的博弈结果。将定量分析与定性分析相结合,为此提出了加大惩罚力度,加强老师的监管,同时对作弊行为公开处罚等相关建议,减少考试作弊行为。
关键词:博弈论;考试作弊;监管模型
1.零和博弈情況
模型假设:
考试过程中无监管机制,学生不会因作弊存在惩罚的风险。假设只有局部人A、B两人进行参与考试,两人对总分为M的题进行抢答,A、B在都诚信答题情况下获得相应的效益为枷。、rviB(公式),若作弊成功可多获得效益c,而两人进行恶性竞争则均要付出q的成本。两人的策略集合为SA={ ai=减信,a2作弊};SB={β1=诚信,β2:=作弊},两人同时采取相应策略。
模型构建:
若(公式)时,博弈过程为零和博弈。
(I)(公式)
(公式)
则赢得矩阵不存在鞍点,因此应为混合策略的均衡.设A以x概率选择α1.则以(1-x)的概率选择a2,同理B以y的概率选择β1,则以(1一y)的概率选择β2,X=(x,1-x) Y=(y,l—y),则局中人A在混合策略下赢得的数学期望为:(公式)
类似于纯策略下的情况若使得以下等式成立:(公式)
则称E ()为对策r的值:()为对策r在混合策略下的解(简称解);x’,Y+分别为局中人A和B的最优混合策略(简称最优策略)。因此:公式
所以局中入应采取(公式)的最优混合策略:
对策的值为(公式)
此时赢得矩阵存在鞍点,即(α1,β1)(α2,β2),即A、B两个局中人都采取作弊,或者都采取不作弊。
模型分析:
在零和博弈的过程中,由于c值不同因此相应的决策选择方式不同,当c值较小的时候,即c具有惩罚情况分析造成上述博弈结果的原因是因为,参与博弈的局中人为理性人,进行作弊时局中人可以不付出代价来获得超额利润,因此存在严格劣策略,从而使局中人放弃诚信考试的选择进行作弊行为。所以不能仅靠局中人白觉性来维护博弈过程,应该通过外界的惩罚使得局中人不存在占优均衡,或者使得诚信策略为占有策略。基于不同的学生所获得的效益值不同,因此将分析具有惩罚情况下成绩不同的两个局中人的博弈过程。模型假设:考试过程中存在惩罚情形,局中人A、B具有不同的成绩MA、
由于信息的不对称,因此两个局中人将会随机选择不同的策略,因此将会产生4种不同的策略组合,如下所示:
(1)(α1,β1):两局中人均选择诚信原则,不会产生相应的利润也不会付出成本,则两人获得的收益相同均为初始收益MA,MB。
(2)(α1,β2):此时局中人A选择诚信考试,局中人B选择作弊行为,此时对于B而言存在因作弊产生的超额收益C,也会相应面临因作弊失败而承受的成本F,因此,局中人B将会有的收益。而对于局中人A而言仅有初始的M。的收益。
(3)(α2,β1):此时局中人B选择诚信考试,局中人A选择作弊行为,此时对于A而言存在因作弊产生的超额收益CA,也会相应面临因作弊失败而承受的成本F,因此E,局中人A将会有的收益。而对于局中人B而言仅有初始Ⅲ。的收益。
(4)(α2,β2):这时双方均采取作弊行为,此时两人因考试作弊分别获得的平均收益,但局中人A将会面临更大的作弊风险。局中人B可以通过作弊行为将成绩提高。但双。根据边际效用递减规律,如果选择而作弊分别能获得CA、CB的额外收益,而如果作弊失败将会有F的作弊成本,作弊成功和失败各有的概率( CA
模型构建:方进行恶性竞争时,都会具有q的损失,因此对于局部人A、B分别而言,最终的超额收益分别为
模型分析:
该博弈过程的纳什均衡为(αi,β2),由此可以看出引入外部惩罚,有利于引导局中人采取公平诚信的竞争方法。而如果加大惩罚力度,使得F> CB时,由图易看出对于局部人A而言αi策略仍为占优策略,而对于局中人B而言,在局部人A选择ai策略的情况下,β2策略为占优策略,因此纳什均衡解为(α1,β1),B也会选择β1策略。因此对于成绩好的学生而言,引入较少的作弊成本后就可以引导其选择正确的行为,而对于成绩差的学生引入较高的作弊成本,降低其预期收益,从而引导其诚信行为。
参考文献:
[1]路遥,浩洪涛.基于博弈论的大学生诚信考试问题研究[J].文教资料,2012(1): 216-218.
[2]罗建,基于博弈论的大学生考试作弊与反作弊分析[J].考试 周刊,2013(1): 3-5.
(作者单位:中国农业大学经济管理学院)
摘要:本文基于博弈论的理论,通过静态博弈、动态博弈两种手段,分析了不具有监管情形、具有惩罚情形情形下的博弈情况,来更好的探究在考试过程中的博弈结果。将定量分析与定性分析相结合,为此提出了加大惩罚力度,加强老师的监管,同时对作弊行为公开处罚等相关建议,减少考试作弊行为。
关键词:博弈论;考试作弊;监管模型
1.零和博弈情況
模型假设:
考试过程中无监管机制,学生不会因作弊存在惩罚的风险。假设只有局部人A、B两人进行参与考试,两人对总分为M的题进行抢答,A、B在都诚信答题情况下获得相应的效益为枷。、rviB(公式),若作弊成功可多获得效益c,而两人进行恶性竞争则均要付出q的成本。两人的策略集合为SA={ ai=减信,a2作弊};SB={β1=诚信,β2:=作弊},两人同时采取相应策略。
模型构建:
若(公式)时,博弈过程为零和博弈。
(I)(公式)
(公式)
则赢得矩阵不存在鞍点,因此应为混合策略的均衡.设A以x概率选择α1.则以(1-x)的概率选择a2,同理B以y的概率选择β1,则以(1一y)的概率选择β2,X=(x,1-x) Y=(y,l—y),则局中人A在混合策略下赢得的数学期望为:(公式)
类似于纯策略下的情况若使得以下等式成立:(公式)
则称E ()为对策r的值:()为对策r在混合策略下的解(简称解);x’,Y+分别为局中人A和B的最优混合策略(简称最优策略)。因此:公式
所以局中入应采取(公式)的最优混合策略:
对策的值为(公式)
此时赢得矩阵存在鞍点,即(α1,β1)(α2,β2),即A、B两个局中人都采取作弊,或者都采取不作弊。
模型分析:
在零和博弈的过程中,由于c值不同因此相应的决策选择方式不同,当c值较小的时候,即c具有惩罚情况分析造成上述博弈结果的原因是因为,参与博弈的局中人为理性人,进行作弊时局中人可以不付出代价来获得超额利润,因此存在严格劣策略,从而使局中人放弃诚信考试的选择进行作弊行为。所以不能仅靠局中人白觉性来维护博弈过程,应该通过外界的惩罚使得局中人不存在占优均衡,或者使得诚信策略为占有策略。基于不同的学生所获得的效益值不同,因此将分析具有惩罚情况下成绩不同的两个局中人的博弈过程。模型假设:考试过程中存在惩罚情形,局中人A、B具有不同的成绩MA、
由于信息的不对称,因此两个局中人将会随机选择不同的策略,因此将会产生4种不同的策略组合,如下所示:
(1)(α1,β1):两局中人均选择诚信原则,不会产生相应的利润也不会付出成本,则两人获得的收益相同均为初始收益MA,MB。
(2)(α1,β2):此时局中人A选择诚信考试,局中人B选择作弊行为,此时对于B而言存在因作弊产生的超额收益C,也会相应面临因作弊失败而承受的成本F,因此,局中人B将会有的收益。而对于局中人A而言仅有初始的M。的收益。
(3)(α2,β1):此时局中人B选择诚信考试,局中人A选择作弊行为,此时对于A而言存在因作弊产生的超额收益CA,也会相应面临因作弊失败而承受的成本F,因此E,局中人A将会有的收益。而对于局中人B而言仅有初始Ⅲ。的收益。
(4)(α2,β2):这时双方均采取作弊行为,此时两人因考试作弊分别获得的平均收益,但局中人A将会面临更大的作弊风险。局中人B可以通过作弊行为将成绩提高。但双。根据边际效用递减规律,如果选择而作弊分别能获得CA、CB的额外收益,而如果作弊失败将会有F的作弊成本,作弊成功和失败各有的概率( CA
模型构建:方进行恶性竞争时,都会具有q的损失,因此对于局部人A、B分别而言,最终的超额收益分别为
模型分析:
该博弈过程的纳什均衡为(αi,β2),由此可以看出引入外部惩罚,有利于引导局中人采取公平诚信的竞争方法。而如果加大惩罚力度,使得F> CB时,由图易看出对于局部人A而言αi策略仍为占优策略,而对于局中人B而言,在局部人A选择ai策略的情况下,β2策略为占优策略,因此纳什均衡解为(α1,β1),B也会选择β1策略。因此对于成绩好的学生而言,引入较少的作弊成本后就可以引导其选择正确的行为,而对于成绩差的学生引入较高的作弊成本,降低其预期收益,从而引导其诚信行为。
参考文献:
[1]路遥,浩洪涛.基于博弈论的大学生诚信考试问题研究[J].文教资料,2012(1): 216-218.
[2]罗建,基于博弈论的大学生考试作弊与反作弊分析[J].考试 周刊,2013(1): 3-5.
(作者单位:中国农业大学经济管理学院)