论文部分内容阅读
一、引言
人员监督是目前部队监督工作的主要手段,金字塔形的层级模式是人员监督的主要载体。自我军建立以来,这种监督手段为我军各项工作的落实发挥了巨大的作用。但是目前,依靠人员进行监督的方法出现了一些新问题。首先,“落实制度”难以落到实处,难以持之以恒。在层级管理中,往往上级的指示要求在最基层的人员监督中失去效力,监督效果“上紧下松”大打折扣,或者在强调期间“突击达标”,无法长期坚持。其次,通过监督的层级结构“加强教育”,但结果总是“屡教不改”,不能从根本上思想上解决问题关键。教育经常搞,效果却逐渐减弱。最后,“麻痹思想”天天提醒,但是同志们“无动于衷”,对于一些安全隐患和违反制度的行为没有警惕性。这些问题,导致制定出来的“制度”难以成为人们习惯于执行的“制度”,对维护部队严明的纪律和保持良好的安全稳定的环境造成了不利因素。
出现这些问题的直接原因有以下几个方面:一、目前部队总体的局势和环境比较平稳,可能发生的突发状况几率减小。二、整个社会环境信息化水平提高,人们有更多的手段提前预知检查等情况,方便于脱离监督,逃避惩罚,导致违纪行为被发现和被惩罚的几率变小。监督制度在设定过程中没有考虑监督者的行为选择。本文利用博弈论作为分析工具,从发生违纪活动被发现和被惩罚的概率出发,深入研究这一问题的发生过程,分析人员监督出现问题的深层原因,从而得出相应的对策。
二、模型分析
由于在最基层的监督活动中,监督者和被监督者处于同一个生活环境内,与被监督者的生活环境和作息时间基本一致。因此认为如果被监督者违反制度,必然会被监督者发现,即假设监督者发现违纪行为的概率为1。同时,认为如果监督者对违纪行为进行阻止,被监督者必然会停止违纪。
(一) 完全信息条件下的简单模型——模型1
假设只有两个参与人,分别为监督者和被监督者,以便区分定义为monitor和player。
1. 当player选择违反制度时,monitor发现的概率为1,并进行阻止,player停止违反制度行为,人员监督制度有效。假设此时player由于未能达到预期目的,且对monitor有所不满,其收益组合设为(-1,-1)。
2. 当player选择违反制度时,monitor虽然发现但是没有阻止,player继续违纪行为,在此过程中,被发现和惩罚的发生概率为r:如果由于此违纪行为发生而导致惩罚,player和monitor共同负责,假设此时的收益组合为(-1000,-1000)。如果虽然进行了违纪行为,但没有被发现和惩罚,player实现了预期目的,两者的收益组合为(2,0)。
3. 如果没有发生违纪行为,收益组合为(0,0)。
4. 假设以上假设条件以及违反制度时惩罚的发生概率为所有的参与人所知,是共同知识。假设所有参与人都是风险中性者。
将模型表示为扩展式,则有:
设monitor阻止的概率为p,则有以下分析:
U(阻止)=-1;
U(不阻止)=r*E(发生惩罚)+(1-r)E(未发生惩罚)=-1000r。
当U(阻止)>U(不阻止),即r>1/1000时,monitor会选择阻止。反之,当U(阻止)1/1000),其战略可表示为(阻止,不阻止,P(r>1/1000),P(r<1/1000))。
设player选择违纪的概率为m,则有以下分析:
U(违纪)=-p+(1-p)[-1000r+2(1-r)]=(2+1002p*r-3p-1002r);
U(不违纪)=0。
由于p是r的函数,设r<1/1000,则p=0,U(违纪)=2-1002r。当U(违纪)>0,即r<1/501时,会选择违纪。由此可得,在此模型中当r<1/1000时,m=1,p=0,可见在这种情况下,监督者制度没有对违纪者产生威慑作用;设r>1/1000,则p=1,U(违纪)=-1。违纪者预期到会被阻止,所以选择不违纪。在r∈(1/1000,1/501)时,该制度对违纪者产生威慑作用。
由以上分析得到以下结论:
1. 对于监督者,只有在违反制度发生惩罚概率高于1/1000时,其才会选择阻止。
2. 在此模型中,其他成员的选择同样被违反制度惩罚发生率r决定(因为假设其为风险中性者),而且在此模型中,如果不考虑监督者的反应r对其的控制力比较监督者更小(P(r>1/501)>P(r>1/1000))。制度是否对其产生威慑力,与其可能受到的惩罚和惩罚的分担比例有密切关系。
3. 结合现实情况,r值往往是因情况而异,一般难以衡量,而决定参与者行动的是他们心中对r的认知即r的先验概率。实际中,监督者往往有麻痹大意的思想,进行阻止的情况不多。否则这个问题也不会屡禁不绝。
4. 另外,只要player选择违纪,monitor无论是否阻止,其效用都为负值。从整个博弈看,monitor的收益总是非正的,即参与此博弈不能给其带来任何好处。如果有可以不成为监督者的选择,所有人都不会选择当监督者。
(二) 完全信息条件下的一般模型——模型2
由于player的行为与其可能受到的惩罚和惩罚的分担比例有密切关系,因此将这两个因素变量化。假设惩罚的总损失和惩罚为L(L>0),如果由于此违纪行为发生而导致惩罚,player和monitor共同负责,但其分担比例为a:b,设a/b=t(a、b、t>0),则有此时的收益组合为(-t*L,-(1-t)L)。
将模型表示为扩展式,则有:
对于monitor有:
U(阻止)=-1;
U(不阻止)=-(1-t)r L
所以有:当r<=1/(1-t)L时,p=0,当r>=1/(1-t)L时,p=1,
对于player有:
当r<=1/(1-t)L,p=0时,U(违纪)=2-t r L-2r ,U(不违纪)=0;
当r>1/(1-t)L,p=1时,U(违纪)=-1<0
则有r<=1/(1-t)L且r<=2/(t L+2)时,player会违纪。
由上图可分析得:当2/(t L+2)> 1/(1-t)L时,;1/(1-t)L1/(1-t)L),所以最终不会违纪。在这个范围,即是监督者监督系统对被监督者起威慑作用的区域。此时,t<2-2L-3L,即当monitor惩罚分担率小于
2-2L-3L时,监督者监督系统对被监督者起威慑作用。如果大于这个比例,一方面失去威慑力,另一方面,对monitor不公平。
当2/(t L+2)<1/(1-t)L时,r<=2/(t L+2),player会违纪;r>2/(t L+2)L时,不会违纪。这是player如果仅从自身利益考虑风险情况的选择,监督者监督制度由于分担了部分风险,反而使其受约束的条件变松。
(三) 完全信息条件下多个参与人的情况
假设一次博弈中有n(n>1)个参与人(n>1且n∈Z),其中一个为monitor,其余n-1个为players,设在某一时间player违反制度的概率为m,则有m(n-1)人违纪。显然违反制度引发惩罚概率与同一时间违纪人数密切相关,为了便于计算简单假设其线性相关,即(n)= m(n-1)r。同时引发惩罚后的损失与同一时间违纪人数(惩罚规模)密切相关,设L(n)=Ln-1。
如果只有一个player,则r′ (2)= m r,L(2)=L。则监督者阻止的概率为p(2)=P(m r>1/(1-t)L)。如果n个参与人,则p(n)=( m(n-1)r>1(1-t)Ln-1,因为有n>1,显然有p(n)>p(2)。
(四) 不完全信息下的博弈
在实际情况中,违反制度引发惩罚概率r往往是不可确知的,而且不同情况不同时间地点的r值是各不相同的。因此,人们在对自己的行为做选择往往是根据自己内心对违反制度引发惩罚概率r的先验概率来做决定。
而每人的先验概率都各不相同,但是通过召开安全会议,能够提高监督者,通过监督者对会议精神的传达,能够提高其他人心中的r的先验概率,使其产生警惕。因此安全会议通过先验概率起到一定导向作用。
因此可以认为安全会议的召开是有效率的,那么这种效率能否一直持续?反复召开会议能不能彻底解决安全隐患?
为了便于分析,假设违反制度引发惩罚概率r可能有两种类型(t1,t2)。t1为高类型,违反制度引发惩罚发生率为1,t2为低类型,违反制度引发惩罚发生率为0,各以0.5的概率。Player的行动集合为(违纪,不违纪),monitor的行动集合为(阻止,不阻止)。其他假设同第一个模型。
则有
如果在player违纪,monitor没有阻止时,出现了(2,0)的情况,则参与人认为违反制度引发惩罚发生率为t2低类型的概率将高于0.5。如果参与人在违反纪律后没有引发惩罚,(这种情况客观存在),可以认为,在重复博弈情况下,r的先验概率在不断降低,直到monitor和player都彻底麻痹,或者引发惩罚,出现收益组合(-1000,-1000)的情况。
三 结论、建议以及进一步思考
(一)结论
1.“落实责任”在事故发生概率较小的情况下,并不一定能发挥作用。综合分析,似乎应该有效的监督者监督制度并没有想象中的有效。一方面,监督者缺乏激励,难以从监督行为中得到收益。由于参与监督者从监督行为中始终没有正收益,没有人有动机成为监督者。另一方面,对于普通人员,不但被制度限制的情况较少,还由于惩罚被分担,其违纪的概率反而增加了。因此,应该对监督者增加激励措施,同时责任的分担比例要适当。
2.并不是被监督人数越少越好,适当规模的被监督人是monitor更有激励去进行监督活动。从第三个模型可以解释为什么更高一级管理者更有激励去阻止违纪行为,因为其管理的人数增加,发生惩罚而受到惩罚的风险大大增加。
3.“加强教育”,召开安全会议,进行警示教育,强调惩罚的概率和如果发生惩罚的惩罚,能够起到一定效果,但是有效性与局限性共存。通过定期召开会议能够提高监督效果,但是过于频繁的召开会议将进一步降低monitor的收益,使其积极性进一步降低。
(二)建议
1. 在社会生活中,往往很多看似有效的制度实际上并不一定有效,反而由于提出了这一实际上无效的制度,使管理者认为问题已经得到控制,进而被麻痹,产生制度漏洞,造成损失。因此不能完全信赖这一制度的监督力,应该以预防为主,尽可能防患于未来,进行全面的安全排查,尽可能降低事故发生的可能性。
2.不能仅仅依靠人力的监督方式,应该采取多种监督方式,采用监视设备或自动化系统,降低人力在监督中的作用。同时,对各种安全事故进行分析,掌握不同安全事故的诱因和不同时期发生的概率,以作为参考,帮助把握监督力度。
3.安全教育工作以及会议的开展,应该具有针对性。会议的召开能够起到督促引导作用,但是在次数比较多的情况时将会失效,如果过于频繁,将会起到反作用。应分析安全事故发生的特点和规律,根据安全事故可能发生的时间分布,地点分布和人员分布,抓住关键时间关键地点以及关键人,不应泛泛而谈,过于频繁。夏季天气炎热,容易发生食物中毒、中暑、雷击、失火、车辆事故,冬季由于气候寒冷,容易发生冻伤、冻坏装备、煤气中毒等事故,是预防的重点。在地点上担负看押、看守勤务的中队,由于执勤携枪带弹,防人犯脱逃、枪走火和武器损坏是重点。机动中队训练任务重、强度大,预防训练事故是重点。人员上,目前官兵的人员构成比较复杂,个人经历各有不同,思想难以统一,对“个别人”应该加强监督教育。比如在老兵退伍时期,可以适当增加安全教育的强度。
4.加强对监督者的激励,使其具有参与的动力。适当的对监督者进行奖励,仅仅依靠惩罚,不能完全实现激励效果。监督制度要起到效果,监督人必须能够从监督活动中得到收益,并且其如果没有履行职责将受到惩罚,两者缺一不可。
5.一般认为,监督者需要监督的对象越少,监督活动需要的时间精力越少,因此监督越有效,但是通过模型可以分析得到,监督维度不是越小越好,而是在可能的范围内越大越好。
( 作者通讯地址:武警工程学院陕西 西安710086)
人员监督是目前部队监督工作的主要手段,金字塔形的层级模式是人员监督的主要载体。自我军建立以来,这种监督手段为我军各项工作的落实发挥了巨大的作用。但是目前,依靠人员进行监督的方法出现了一些新问题。首先,“落实制度”难以落到实处,难以持之以恒。在层级管理中,往往上级的指示要求在最基层的人员监督中失去效力,监督效果“上紧下松”大打折扣,或者在强调期间“突击达标”,无法长期坚持。其次,通过监督的层级结构“加强教育”,但结果总是“屡教不改”,不能从根本上思想上解决问题关键。教育经常搞,效果却逐渐减弱。最后,“麻痹思想”天天提醒,但是同志们“无动于衷”,对于一些安全隐患和违反制度的行为没有警惕性。这些问题,导致制定出来的“制度”难以成为人们习惯于执行的“制度”,对维护部队严明的纪律和保持良好的安全稳定的环境造成了不利因素。
出现这些问题的直接原因有以下几个方面:一、目前部队总体的局势和环境比较平稳,可能发生的突发状况几率减小。二、整个社会环境信息化水平提高,人们有更多的手段提前预知检查等情况,方便于脱离监督,逃避惩罚,导致违纪行为被发现和被惩罚的几率变小。监督制度在设定过程中没有考虑监督者的行为选择。本文利用博弈论作为分析工具,从发生违纪活动被发现和被惩罚的概率出发,深入研究这一问题的发生过程,分析人员监督出现问题的深层原因,从而得出相应的对策。
二、模型分析
由于在最基层的监督活动中,监督者和被监督者处于同一个生活环境内,与被监督者的生活环境和作息时间基本一致。因此认为如果被监督者违反制度,必然会被监督者发现,即假设监督者发现违纪行为的概率为1。同时,认为如果监督者对违纪行为进行阻止,被监督者必然会停止违纪。
(一) 完全信息条件下的简单模型——模型1
假设只有两个参与人,分别为监督者和被监督者,以便区分定义为monitor和player。
1. 当player选择违反制度时,monitor发现的概率为1,并进行阻止,player停止违反制度行为,人员监督制度有效。假设此时player由于未能达到预期目的,且对monitor有所不满,其收益组合设为(-1,-1)。
2. 当player选择违反制度时,monitor虽然发现但是没有阻止,player继续违纪行为,在此过程中,被发现和惩罚的发生概率为r:如果由于此违纪行为发生而导致惩罚,player和monitor共同负责,假设此时的收益组合为(-1000,-1000)。如果虽然进行了违纪行为,但没有被发现和惩罚,player实现了预期目的,两者的收益组合为(2,0)。
3. 如果没有发生违纪行为,收益组合为(0,0)。
4. 假设以上假设条件以及违反制度时惩罚的发生概率为所有的参与人所知,是共同知识。假设所有参与人都是风险中性者。
将模型表示为扩展式,则有:
设monitor阻止的概率为p,则有以下分析:
U(阻止)=-1;
U(不阻止)=r*E(发生惩罚)+(1-r)E(未发生惩罚)=-1000r。
当U(阻止)>U(不阻止),即r>1/1000时,monitor会选择阻止。反之,当U(阻止)1/1000),其战略可表示为(阻止,不阻止,P(r>1/1000),P(r<1/1000))。
设player选择违纪的概率为m,则有以下分析:
U(违纪)=-p+(1-p)[-1000r+2(1-r)]=(2+1002p*r-3p-1002r);
U(不违纪)=0。
由于p是r的函数,设r<1/1000,则p=0,U(违纪)=2-1002r。当U(违纪)>0,即r<1/501时,会选择违纪。由此可得,在此模型中当r<1/1000时,m=1,p=0,可见在这种情况下,监督者制度没有对违纪者产生威慑作用;设r>1/1000,则p=1,U(违纪)=-1。违纪者预期到会被阻止,所以选择不违纪。在r∈(1/1000,1/501)时,该制度对违纪者产生威慑作用。
由以上分析得到以下结论:
1. 对于监督者,只有在违反制度发生惩罚概率高于1/1000时,其才会选择阻止。
2. 在此模型中,其他成员的选择同样被违反制度惩罚发生率r决定(因为假设其为风险中性者),而且在此模型中,如果不考虑监督者的反应r对其的控制力比较监督者更小(P(r>1/501)>P(r>1/1000))。制度是否对其产生威慑力,与其可能受到的惩罚和惩罚的分担比例有密切关系。
3. 结合现实情况,r值往往是因情况而异,一般难以衡量,而决定参与者行动的是他们心中对r的认知即r的先验概率。实际中,监督者往往有麻痹大意的思想,进行阻止的情况不多。否则这个问题也不会屡禁不绝。
4. 另外,只要player选择违纪,monitor无论是否阻止,其效用都为负值。从整个博弈看,monitor的收益总是非正的,即参与此博弈不能给其带来任何好处。如果有可以不成为监督者的选择,所有人都不会选择当监督者。
(二) 完全信息条件下的一般模型——模型2
由于player的行为与其可能受到的惩罚和惩罚的分担比例有密切关系,因此将这两个因素变量化。假设惩罚的总损失和惩罚为L(L>0),如果由于此违纪行为发生而导致惩罚,player和monitor共同负责,但其分担比例为a:b,设a/b=t(a、b、t>0),则有此时的收益组合为(-t*L,-(1-t)L)。
将模型表示为扩展式,则有:
对于monitor有:
U(阻止)=-1;
U(不阻止)=-(1-t)r L
所以有:当r<=1/(1-t)L时,p=0,当r>=1/(1-t)L时,p=1,
对于player有:
当r<=1/(1-t)L,p=0时,U(违纪)=2-t r L-2r ,U(不违纪)=0;
当r>1/(1-t)L,p=1时,U(违纪)=-1<0
则有r<=1/(1-t)L且r<=2/(t L+2)时,player会违纪。
由上图可分析得:当2/(t L+2)> 1/(1-t)L时,;1/(1-t)L
2-2L-3L时,监督者监督系统对被监督者起威慑作用。如果大于这个比例,一方面失去威慑力,另一方面,对monitor不公平。
当2/(t L+2)<1/(1-t)L时,r<=2/(t L+2),player会违纪;r>2/(t L+2)L时,不会违纪。这是player如果仅从自身利益考虑风险情况的选择,监督者监督制度由于分担了部分风险,反而使其受约束的条件变松。
(三) 完全信息条件下多个参与人的情况
假设一次博弈中有n(n>1)个参与人(n>1且n∈Z),其中一个为monitor,其余n-1个为players,设在某一时间player违反制度的概率为m,则有m(n-1)人违纪。显然违反制度引发惩罚概率与同一时间违纪人数密切相关,为了便于计算简单假设其线性相关,即(n)= m(n-1)r。同时引发惩罚后的损失与同一时间违纪人数(惩罚规模)密切相关,设L(n)=Ln-1。
如果只有一个player,则r′ (2)= m r,L(2)=L。则监督者阻止的概率为p(2)=P(m r>1/(1-t)L)。如果n个参与人,则p(n)=( m(n-1)r>1(1-t)Ln-1,因为有n>1,显然有p(n)>p(2)。
(四) 不完全信息下的博弈
在实际情况中,违反制度引发惩罚概率r往往是不可确知的,而且不同情况不同时间地点的r值是各不相同的。因此,人们在对自己的行为做选择往往是根据自己内心对违反制度引发惩罚概率r的先验概率来做决定。
而每人的先验概率都各不相同,但是通过召开安全会议,能够提高监督者,通过监督者对会议精神的传达,能够提高其他人心中的r的先验概率,使其产生警惕。因此安全会议通过先验概率起到一定导向作用。
因此可以认为安全会议的召开是有效率的,那么这种效率能否一直持续?反复召开会议能不能彻底解决安全隐患?
为了便于分析,假设违反制度引发惩罚概率r可能有两种类型(t1,t2)。t1为高类型,违反制度引发惩罚发生率为1,t2为低类型,违反制度引发惩罚发生率为0,各以0.5的概率。Player的行动集合为(违纪,不违纪),monitor的行动集合为(阻止,不阻止)。其他假设同第一个模型。
则有
如果在player违纪,monitor没有阻止时,出现了(2,0)的情况,则参与人认为违反制度引发惩罚发生率为t2低类型的概率将高于0.5。如果参与人在违反纪律后没有引发惩罚,(这种情况客观存在),可以认为,在重复博弈情况下,r的先验概率在不断降低,直到monitor和player都彻底麻痹,或者引发惩罚,出现收益组合(-1000,-1000)的情况。
三 结论、建议以及进一步思考
(一)结论
1.“落实责任”在事故发生概率较小的情况下,并不一定能发挥作用。综合分析,似乎应该有效的监督者监督制度并没有想象中的有效。一方面,监督者缺乏激励,难以从监督行为中得到收益。由于参与监督者从监督行为中始终没有正收益,没有人有动机成为监督者。另一方面,对于普通人员,不但被制度限制的情况较少,还由于惩罚被分担,其违纪的概率反而增加了。因此,应该对监督者增加激励措施,同时责任的分担比例要适当。
2.并不是被监督人数越少越好,适当规模的被监督人是monitor更有激励去进行监督活动。从第三个模型可以解释为什么更高一级管理者更有激励去阻止违纪行为,因为其管理的人数增加,发生惩罚而受到惩罚的风险大大增加。
3.“加强教育”,召开安全会议,进行警示教育,强调惩罚的概率和如果发生惩罚的惩罚,能够起到一定效果,但是有效性与局限性共存。通过定期召开会议能够提高监督效果,但是过于频繁的召开会议将进一步降低monitor的收益,使其积极性进一步降低。
(二)建议
1. 在社会生活中,往往很多看似有效的制度实际上并不一定有效,反而由于提出了这一实际上无效的制度,使管理者认为问题已经得到控制,进而被麻痹,产生制度漏洞,造成损失。因此不能完全信赖这一制度的监督力,应该以预防为主,尽可能防患于未来,进行全面的安全排查,尽可能降低事故发生的可能性。
2.不能仅仅依靠人力的监督方式,应该采取多种监督方式,采用监视设备或自动化系统,降低人力在监督中的作用。同时,对各种安全事故进行分析,掌握不同安全事故的诱因和不同时期发生的概率,以作为参考,帮助把握监督力度。
3.安全教育工作以及会议的开展,应该具有针对性。会议的召开能够起到督促引导作用,但是在次数比较多的情况时将会失效,如果过于频繁,将会起到反作用。应分析安全事故发生的特点和规律,根据安全事故可能发生的时间分布,地点分布和人员分布,抓住关键时间关键地点以及关键人,不应泛泛而谈,过于频繁。夏季天气炎热,容易发生食物中毒、中暑、雷击、失火、车辆事故,冬季由于气候寒冷,容易发生冻伤、冻坏装备、煤气中毒等事故,是预防的重点。在地点上担负看押、看守勤务的中队,由于执勤携枪带弹,防人犯脱逃、枪走火和武器损坏是重点。机动中队训练任务重、强度大,预防训练事故是重点。人员上,目前官兵的人员构成比较复杂,个人经历各有不同,思想难以统一,对“个别人”应该加强监督教育。比如在老兵退伍时期,可以适当增加安全教育的强度。
4.加强对监督者的激励,使其具有参与的动力。适当的对监督者进行奖励,仅仅依靠惩罚,不能完全实现激励效果。监督制度要起到效果,监督人必须能够从监督活动中得到收益,并且其如果没有履行职责将受到惩罚,两者缺一不可。
5.一般认为,监督者需要监督的对象越少,监督活动需要的时间精力越少,因此监督越有效,但是通过模型可以分析得到,监督维度不是越小越好,而是在可能的范围内越大越好。
( 作者通讯地址:武警工程学院陕西 西安710086)