论文部分内容阅读
摘 要:博弈论研究的是人与人在交往互动中,通过考虑对方的预测行为和实际行为作出的最优策略。大学数学教学是一种特定的学科教学,是一种师生间的交流互动。博弈论代表着一种全新的分析方法和思维方式,大学数学教学融入博弈思想能够为教师和学生提供双赢的最优策略。对教师而言,是一种有效的课堂教学策略;对教师和学生双方而言,是一种纳什均衡状态;对日常课堂教学而言,是一种轻松和谐氛围的辅助剂。博弈理论已成为现阶段高校运用最广泛的教学手段。
关键词:博弈 纳什均衡 智猪博弈 大学数学教学 教学手段
1、博弈理论
博弈是数学,是运筹学的一个新型分支,是指个人、团队或者其他组织,面对一定的环境条件、在一定的约束条件下依靠自身掌握的信息,同时或先后,一次或多次从各自可能的行为或策略集合中做出自己的选择并予以实施,从中获得各自利益的最大化的动态过程。一个标准的博弈应当包括参与者,行为,信息,策略、次序、收益、结果、均衡八个方面。
大学数学教学,有高校教师与大学生两个博弈方的参与,在一定的“环境”下,在一定“规则”的约束下,合作或非合作地实施相互的教或学的行为,并依据课堂内外的种种教与学的相关信息,同时或先后,选择各自的最优策略,探求一种积极、高效、求真、和谐均衡的教与学的结果,以期谋求各自利益的最大化。
因此,大学数学教学是一场标准的博弈,是一场能动性强,发展变化的博弈。
博弈论的种种思想,例如互动条件下的最优策略思想、均衡思想、模拟思想,不确定理论的思想、合作与非合作博弈思想、完全且完美信息或不完全信息博弈思想、静态与动态博弈思想,均与大学数学教学有着某种天然的契合,“copy”即用,不费吹灰之力,是一种新型高效的教学思维方式。
2、博弈理论与大学数学教学
2.1 互动条件下的最优策略——智猪博弈
“智猪博弈”(Pigs’payoffs)是一则经典博弈模型。模型背景为:猪圈里有一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的食槽就会有10单位的猪食进槽,但每按一下按钮会耗去相当于2单位猪食成本。如果大猪先去踩踏板,大猪可吃到9个单位猪食,小猪只能吃1个单位猪食;如果小猪先去踩动踏板,大猪吃6个单位猪食,小猪吃4个单位猪食。如果大猪小猪同时去踩踏板,大猪吃7个单位猪食,小猪吃3个单位猪食。那么,两只猪各会采取什么策略?
由模型分析可得出大小猪的赢得函数:
赢得函数显示,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己去踩踏板总比不踩强,所以只好亲自为之了,即“小猪躺着大猪跑”。
2.1.1 数学课堂上的“智猪博弈”
在大学从教一年,大学数学课堂上经常出现以下两种场景。一种场景是学生做“小猪”,舒舒服服地在下面听讲甚至逃课而不去主动思考,成绩却能及格,有时分数还很高;老师做“大猪”,疲于奔命,课下拼命备课,课上拼命授课,讲完概念讲例题,讲完例题讲练习,讲完練习玩游戏,多多少少给学生灌了一点知识,学生取得了好成绩就是对老师的奖励;另一种场景是学习不是很好的一部分学生做“小猪”,不练习不计算,把别人的作业答案“copy主义”,学习好的做“大猪”,同样疲于奔命,虽然眼瞅着自己的“果实”被“小猪”所用,但还是只能无奈地继续做好自己的本分,认真学习。
为什么会出现这样的情况呢?“小猪”们会认定:大家是一个共同体,就是有责罚,也是落在大家的身上,所以一定会有“大猪”悲壮地跳出来担当重任。
由于学科的自身特点,数学课的教学相对于其它学科的教学而言往往缺乏生动,且它的科学性、系统性和严密的逻辑推理性难以加入较多的感情色彩。学生主动学与被动学的结果是:主动学的奖励不够,被动学的惩罚太轻,最终的学习成绩很难做出明确的区分,在这样的尴尬下,学生对数学的学习热情难以长时间维持延续,学生们会在最初的几节课后形成惰性,等着老师来解决一切问题,老师就成了“大猪”,学生是“小猪”;学习程度不好的学生更会等待那些他们认为学习好的同学忙碌的结果的,学习好的学生成了“大猪”,学的不好懒惰的学生是“小猪”。即使在教学方法和策略相对灵活的美国,这样一些观念在学生中也很普遍,如“学习数学的方法是记忆和模仿,你无须去理解,也不可能真正搞懂”、“教师的职责是给予,学生的职责是接受”等。在数学面前,学生多处于被动的状态,在部分刻苦努力的学生面前,大多数学生同样也处于被动的状态。
2.1.2 摆脱数学教学的“搭便车”现象
为了试图先解决学生“小猪”与学生“大猪”之间的问题,我们以博弈理论为基础,假设以下四种新的游戏规则。
新规则一:减量方案或称为评价机制。如果课堂上缺少了应有的评价,那么就会造成老师和学生的惰性,也使得学习成绩相对好的学生不愿意再努力。
新规则二:增量方案。老师如果一味地采用表扬评价,或多次揭示其不足,指明努力方向,或长期地高标准、严要求训导,这样的评价就很难成为强化或矫正学生所学知识的手段,而且不易成为激发各层学生搞好学习的催化剂。
新规则三:减量加移位方案。评价的作用在于强调其形成性作用,注重发展功能。一次评价不仅是对一段活动的总结,更是下一段活动的起点、向导和动力。在学生的评价上,为了激励每个学生,在平时应变过去百分制为等级制,变过去偏重知识评价为综合评价,变期末鉴定式评语为学科激励式评语。
新规则四:分层教学。分层次教学是对传统的班级授课制(如“齐步走”的教学模式)的重大突破,促进了教育资源的优化组合。分层教学可使教师在备课、上课、作业布置、学法辅导等环节得到优化,更有针对性,真正体现因材施教,使教育者和受教育者得到很好的结合,教学实施更具有实际意义。 2.2非合作博弈的“纳什均衡”
博奕论另一个经典模型是“囚徒困境”模型。模型背景是:两个囚徒一起做坏事,结果被警察抓了起来,警方没有足够证据指控二人入罪。于是警方将其分开关在两个独立不能互通信息的牢房进行审讯,并向双方提供以下相同的选择:
若一人认罪并作证检控对方(“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监5年。
若二人都保持沉默(互相“合作”),则二人同样判监1年。
若二人都互相检举(互相“背叛”),则二人同样判监3年。
那么,这两个小偷将如何选择?
模型分析可得两位嫌疑犯的支付矩阵(如下所示):
支付矩阵显示,甲乙将选择“背叛、背叛”策略。因为他们都是在坦白与抵赖策略上首先想到自己,这样他们必然要服3年刑期。只有当他们都首先替对方着想时,或者相互沉默(合作)时,才可以得到最短时间(1年)的监禁结果。但是由于两人处于隔离的情况下无法串供。这样两人都选择坦白的策略以及因此被判3年的结局就被称为“纳什均衡”,也叫非合作均衡。也就是说一策略组合中,所有的参与者面临这样的一种情况,当其他人改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略,他的支付将会降低。
2.2.1师生激情博弈的“纳什均衡”
学院一直开展着专业与公共课程的教学改革, 为提高教学质量引进了新的教育评价机制, 它不仅要求教师要对学生进行评价,也要求学生对教师进行评价打分。这种机制的可行性如何? 我们用师生激情博弈给以证明。
博弈是对战略相互作用的描述,设博弈的参与人为教师和学生;教师的战略是上课有激情和无激情,学生的战略是有兴趣和无兴趣(教师的激情和学生的兴趣正相关);以师生在课堂上教学互动为条件,取教师对学生的印象评价及学生对教师的印象评价为支付, 具体模型见下表。
上表显示,在师生激情博弈中我们得到该博弈具有唯一的纳什均衡解: “教师有激情, 学生有兴趣”。纳什均衡是一种战略组合, 它表示这种战略组合由所有参与人的最优战略组成,且没有任何人有积极性打破这种均衡。师生激情博弈输出的信息告诉我们, 进行师生间的相互评价有利于向管理目标靠近, 当然我们也看到,如果学生学习无兴趣, 那么学生对教师的评价就有失公平, 优质资源得不到充分发挥。因此我们首先需要解决的问题是: 怎样充分调动学生学习的积极性, 使学习变被动学习为主动学习。
三、总结
皮亚杰认为,“结构就是由具有整体性的若干转换规律组成的一个有自身调整性质的图式体系。”为什么要調整?因为倾斜,因为失衡。我们能感受到博弈思想与数学教学和而不同、不同而和的默契的应和与渊源。在博弈思想的牵引下,我们要追求一种给定对方的策略而选择了最好策略的空间与境地,我们要营造一种协调的、适度的、稳定的结构与状态——让数学课堂从倾斜走向均衡。
参考文献
1 高华云.博弈论教学中增强学生理解能力的几种方法[J].武汉商业服务学院学报,2013,1
2 孙颖颖.犯罪率的博弈论分析[J].商,2014.3
3. 叶露.走近博弈论探索者的心战人生[J].重庆行政(公共人物),2013.5
4. 段鹏飞.论经济学的课堂实验教学法[J].东北财经大学学报,2005.6
作者简介:苏又(1986-),桂林市灵川县,中南大学概率论与数理统计专业硕士研究生毕业,现在广西师范大学数学与统计学院概率统计教研室任助教。
关键词:博弈 纳什均衡 智猪博弈 大学数学教学 教学手段
1、博弈理论
博弈是数学,是运筹学的一个新型分支,是指个人、团队或者其他组织,面对一定的环境条件、在一定的约束条件下依靠自身掌握的信息,同时或先后,一次或多次从各自可能的行为或策略集合中做出自己的选择并予以实施,从中获得各自利益的最大化的动态过程。一个标准的博弈应当包括参与者,行为,信息,策略、次序、收益、结果、均衡八个方面。
大学数学教学,有高校教师与大学生两个博弈方的参与,在一定的“环境”下,在一定“规则”的约束下,合作或非合作地实施相互的教或学的行为,并依据课堂内外的种种教与学的相关信息,同时或先后,选择各自的最优策略,探求一种积极、高效、求真、和谐均衡的教与学的结果,以期谋求各自利益的最大化。
因此,大学数学教学是一场标准的博弈,是一场能动性强,发展变化的博弈。
博弈论的种种思想,例如互动条件下的最优策略思想、均衡思想、模拟思想,不确定理论的思想、合作与非合作博弈思想、完全且完美信息或不完全信息博弈思想、静态与动态博弈思想,均与大学数学教学有着某种天然的契合,“copy”即用,不费吹灰之力,是一种新型高效的教学思维方式。
2、博弈理论与大学数学教学
2.1 互动条件下的最优策略——智猪博弈
“智猪博弈”(Pigs’payoffs)是一则经典博弈模型。模型背景为:猪圈里有一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的食槽就会有10单位的猪食进槽,但每按一下按钮会耗去相当于2单位猪食成本。如果大猪先去踩踏板,大猪可吃到9个单位猪食,小猪只能吃1个单位猪食;如果小猪先去踩动踏板,大猪吃6个单位猪食,小猪吃4个单位猪食。如果大猪小猪同时去踩踏板,大猪吃7个单位猪食,小猪吃3个单位猪食。那么,两只猪各会采取什么策略?
由模型分析可得出大小猪的赢得函数:
赢得函数显示,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己去踩踏板总比不踩强,所以只好亲自为之了,即“小猪躺着大猪跑”。
2.1.1 数学课堂上的“智猪博弈”
在大学从教一年,大学数学课堂上经常出现以下两种场景。一种场景是学生做“小猪”,舒舒服服地在下面听讲甚至逃课而不去主动思考,成绩却能及格,有时分数还很高;老师做“大猪”,疲于奔命,课下拼命备课,课上拼命授课,讲完概念讲例题,讲完例题讲练习,讲完練习玩游戏,多多少少给学生灌了一点知识,学生取得了好成绩就是对老师的奖励;另一种场景是学习不是很好的一部分学生做“小猪”,不练习不计算,把别人的作业答案“copy主义”,学习好的做“大猪”,同样疲于奔命,虽然眼瞅着自己的“果实”被“小猪”所用,但还是只能无奈地继续做好自己的本分,认真学习。
为什么会出现这样的情况呢?“小猪”们会认定:大家是一个共同体,就是有责罚,也是落在大家的身上,所以一定会有“大猪”悲壮地跳出来担当重任。
由于学科的自身特点,数学课的教学相对于其它学科的教学而言往往缺乏生动,且它的科学性、系统性和严密的逻辑推理性难以加入较多的感情色彩。学生主动学与被动学的结果是:主动学的奖励不够,被动学的惩罚太轻,最终的学习成绩很难做出明确的区分,在这样的尴尬下,学生对数学的学习热情难以长时间维持延续,学生们会在最初的几节课后形成惰性,等着老师来解决一切问题,老师就成了“大猪”,学生是“小猪”;学习程度不好的学生更会等待那些他们认为学习好的同学忙碌的结果的,学习好的学生成了“大猪”,学的不好懒惰的学生是“小猪”。即使在教学方法和策略相对灵活的美国,这样一些观念在学生中也很普遍,如“学习数学的方法是记忆和模仿,你无须去理解,也不可能真正搞懂”、“教师的职责是给予,学生的职责是接受”等。在数学面前,学生多处于被动的状态,在部分刻苦努力的学生面前,大多数学生同样也处于被动的状态。
2.1.2 摆脱数学教学的“搭便车”现象
为了试图先解决学生“小猪”与学生“大猪”之间的问题,我们以博弈理论为基础,假设以下四种新的游戏规则。
新规则一:减量方案或称为评价机制。如果课堂上缺少了应有的评价,那么就会造成老师和学生的惰性,也使得学习成绩相对好的学生不愿意再努力。
新规则二:增量方案。老师如果一味地采用表扬评价,或多次揭示其不足,指明努力方向,或长期地高标准、严要求训导,这样的评价就很难成为强化或矫正学生所学知识的手段,而且不易成为激发各层学生搞好学习的催化剂。
新规则三:减量加移位方案。评价的作用在于强调其形成性作用,注重发展功能。一次评价不仅是对一段活动的总结,更是下一段活动的起点、向导和动力。在学生的评价上,为了激励每个学生,在平时应变过去百分制为等级制,变过去偏重知识评价为综合评价,变期末鉴定式评语为学科激励式评语。
新规则四:分层教学。分层次教学是对传统的班级授课制(如“齐步走”的教学模式)的重大突破,促进了教育资源的优化组合。分层教学可使教师在备课、上课、作业布置、学法辅导等环节得到优化,更有针对性,真正体现因材施教,使教育者和受教育者得到很好的结合,教学实施更具有实际意义。 2.2非合作博弈的“纳什均衡”
博奕论另一个经典模型是“囚徒困境”模型。模型背景是:两个囚徒一起做坏事,结果被警察抓了起来,警方没有足够证据指控二人入罪。于是警方将其分开关在两个独立不能互通信息的牢房进行审讯,并向双方提供以下相同的选择:
若一人认罪并作证检控对方(“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监5年。
若二人都保持沉默(互相“合作”),则二人同样判监1年。
若二人都互相检举(互相“背叛”),则二人同样判监3年。
那么,这两个小偷将如何选择?
模型分析可得两位嫌疑犯的支付矩阵(如下所示):
支付矩阵显示,甲乙将选择“背叛、背叛”策略。因为他们都是在坦白与抵赖策略上首先想到自己,这样他们必然要服3年刑期。只有当他们都首先替对方着想时,或者相互沉默(合作)时,才可以得到最短时间(1年)的监禁结果。但是由于两人处于隔离的情况下无法串供。这样两人都选择坦白的策略以及因此被判3年的结局就被称为“纳什均衡”,也叫非合作均衡。也就是说一策略组合中,所有的参与者面临这样的一种情况,当其他人改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略,他的支付将会降低。
2.2.1师生激情博弈的“纳什均衡”
学院一直开展着专业与公共课程的教学改革, 为提高教学质量引进了新的教育评价机制, 它不仅要求教师要对学生进行评价,也要求学生对教师进行评价打分。这种机制的可行性如何? 我们用师生激情博弈给以证明。
博弈是对战略相互作用的描述,设博弈的参与人为教师和学生;教师的战略是上课有激情和无激情,学生的战略是有兴趣和无兴趣(教师的激情和学生的兴趣正相关);以师生在课堂上教学互动为条件,取教师对学生的印象评价及学生对教师的印象评价为支付, 具体模型见下表。
上表显示,在师生激情博弈中我们得到该博弈具有唯一的纳什均衡解: “教师有激情, 学生有兴趣”。纳什均衡是一种战略组合, 它表示这种战略组合由所有参与人的最优战略组成,且没有任何人有积极性打破这种均衡。师生激情博弈输出的信息告诉我们, 进行师生间的相互评价有利于向管理目标靠近, 当然我们也看到,如果学生学习无兴趣, 那么学生对教师的评价就有失公平, 优质资源得不到充分发挥。因此我们首先需要解决的问题是: 怎样充分调动学生学习的积极性, 使学习变被动学习为主动学习。
三、总结
皮亚杰认为,“结构就是由具有整体性的若干转换规律组成的一个有自身调整性质的图式体系。”为什么要調整?因为倾斜,因为失衡。我们能感受到博弈思想与数学教学和而不同、不同而和的默契的应和与渊源。在博弈思想的牵引下,我们要追求一种给定对方的策略而选择了最好策略的空间与境地,我们要营造一种协调的、适度的、稳定的结构与状态——让数学课堂从倾斜走向均衡。
参考文献
1 高华云.博弈论教学中增强学生理解能力的几种方法[J].武汉商业服务学院学报,2013,1
2 孙颖颖.犯罪率的博弈论分析[J].商,2014.3
3. 叶露.走近博弈论探索者的心战人生[J].重庆行政(公共人物),2013.5
4. 段鹏飞.论经济学的课堂实验教学法[J].东北财经大学学报,2005.6
作者简介:苏又(1986-),桂林市灵川县,中南大学概率论与数理统计专业硕士研究生毕业,现在广西师范大学数学与统计学院概率统计教研室任助教。