论文部分内容阅读
摘 要:本研究以265名大学生为被试,从认知加工的角度出发,探讨了贝叶斯促进的心理机制和个体差异。结果表明:①认知反思能力的主效应显著,信息表征主效应显著,认知反思能力和信息表征对贝叶斯推理估计准确性影响的交互作用显著;②进一步简单效应分析结果表明,在概率加树图表征格式和频数表征下,随着认知反思能力越高,贝叶斯推理的估计准确性越高;认知反思能力不同的个体之间,贝叶斯促进确实存在差异。本研究支持嵌套集合理论。
关键词:贝叶斯推理;自然频数促进效应;认知反思能力
日常生活中人们经常会根据不确定信息来做出决策和判断。而且随着思考者年龄的增长,这类判断变得越来越重要(Fisk,2005)。贝叶斯推理正是在已知基础比率的情况下,利用击中率和误报率对该信息进行调整并做出判断的过程(史滋福,王香香,陈姣,张庆林,2010)。研究发现,人们的贝叶斯推理并不完全遵循贝叶斯公式的计算过程,容易导致认知谬误(Cognitive illusion)(Kahnemen &Tversky,1972)。以Gigerenzer和Hoffrage(1995)为代表的自然频数假设(natural frequency hypothesis)认为,以频数格式代替概率格式对问题进行表征时,所谓的“认知谬误”就会消失。Sloman,Over,Slovak和Stibel (2003)将这种在自然频数条件下对贝叶斯推理普遍促进的现象称为贝叶斯促进(Bayesian facilitation)。
近年来,有关贝叶斯促进已达成共识,但对其解释仍存在分歧:生态理性框架(Ecological Rationality Framework)认为人们平时所遇到的问题都是频数形式的信息,因此,人们的心智适应于频数形式,非频数形式倾向于导致较低的推理成绩(Cosmides&Tooby,1996)。而嵌套集合理论(Nested Sets Theory)认为频数的促进效应是由于自然频数的表征使集合的“嵌套”关系形象化了(Meller & Mcgraw,1999;Sloman,et al.,2003;Zhu & Gigerenzer,2006;Lesage,Navarrete,&De Neys,2013等)。为此,Barbey和Sloman(2007)进一步从推理双过程的角度予以阐释,自然频数格式使嵌套集合结构更加突出,从而诱发了分析系统,导致推理者在收集执行资源后得出正确答案。而在概率格式中,由于集合表征模糊,分析系统没有得到诱发,推理者无法正确应用规则,只能通过启发式系统,最终导致有偏差的答案。史滋福、邱江和张庆林(2006)结果发现:完整和不完整的树图表征,有助于明确嵌套集合关系,显著地促进了推理成绩。这也从另一个侧面证明了嵌套集合关系明确对贝叶斯推理的促进效应。
此外,研究者对频率促进效应的普遍性也存在分歧。如Chapman和Liu(2009)利用贝叶斯推理的“医学问题”和“汽车问题”进一步研究频率促进效应的普遍性。结果发现,理解和操纵自然频率需要一定程度的数字运算能力,只有数字运算能力测试上获高分的被试才发生频数表征促进效应。这说明频数促进效应并不是普遍现象,它仅适用于某种类型的推理者。考虑到另一项研究(史滋福等,2006)表明叙述理由引发的元认知监控也可以显著地促进推理成绩。而认知反思能力作为一种抑制错误直觉的倾向,是反映认知加工中个体差异的一个重要成分(Frederick,2005)。基于此,似乎有必要从个体差异的角度来寻求贝叶斯促进的机制。本研究假设认知反思能力高的个体更容易监控自己的思维,调整认知偏向,在自然频数和树图表征下推理成绩更好。
另外,对贝叶斯促进的认知过程,生态理性框架和嵌套集合假设理论二者对一般认知资源对贝叶斯促进的作用持相反态度。为此,本研究的整体思路是检验认知反思能力在自然频数表征、概率加完整树图、概率表征三种条件下的表现,进一步厘清促进效应产生的条件和机制。本研究假设,不同认知反思能力个体的贝叶斯促进的程度不同;自然频数和概率加树图表征都诱发了推理者的分析过程,从而表现出好于概率形式下个体的推理成绩;认知反思能力与信息表征对贝叶斯推理成绩的影响的交互作用显著,具体表现为,高认知反思能力的推理者在自然频数和树图表征下的贝叶斯推理成绩较低认知反思能力者的要好,而在概率形式下与低认知反思能力个体不存在差异。
1研究方法
1.1被试
某省三所高校随机抽取265名大学生(其中文科136人,理科129人),均不熟悉貝叶斯规则,平均年龄20.04岁。
1.2实验材料
1.2.1认知反思测验(Cognitive Reflection Test)
CRT用于测量一般执行认知能力差异(general executive cognitive capacity),反映被试抑制自发的但不正确答案的能力,曾在推理和决策的研究中多次用到(Evens,2010)。CRT是智力广度和执行功能测验的指标,也是对各种推理任务中表现的测量指标(Frederick,2005;Toplak,West,& Stanovich,2011),其与WPT和ACT的相关系数分别为0.43和0.46(Lesage,et al.,2013),该问卷的克伦巴赫系数α=0.61(Sirota,Juanchich,&Hagmayer,2014)。
1.2.2贝叶斯推理材料
采用经典的乳癌问题作为实验材料,并以概率、自然频数、概率加树图表征三种信息表征来表述。
1.3实验设计
本研究采用2(认知反思能力:高认知反思能力/低认知反思能力)×3(信息表征:概率/自然频数/概率加树图)的被试间设计。因变量为后验概率估计准确性(以后验概率估计值与使用贝叶斯定理计算出的标准值两者之差的绝对值为指标),绝对值差异越大,估计准确性越差。 1.4实验程序
利用上课时间集体测试,将三种实验材料与CRT装订成册,按照1∶1∶1的比例混合随机分发给被试。被试理解实验任务的要求后开始完成后面的实验任务,提醒被试独立完成,随后将材料收回,完成任务大约需要10分钟。
2结果分析
剔除没有按要求完成的24份,有效被试241人。将有效答卷的数据输入计算机,运用SPSS19.0统计软件包进行处理。结果如下:
2.1认知反思能力的基本情况和分类
CRT平均得分为2.237,标准差为0.879。参照以往研究(Frederick,2005)把CRT中得分为3的被试(即完全答对的被试)归为认知反思能力高分组,得分为0和1的被试归为认知反思能力低分组。该分类和Sirota等人(2014)、Lesage等人(2013)、Sirota和Juanchich(2011)的研究中的分类也相似。对两组CRT的得分进行独立样本t检验,差异极显著(t(57)=-44.939,p<0.01),说明这种分类有效。
2.2认知反思能力和信息表征对贝叶斯推理估计准确性的影响
以被试的后验估计值与使用贝叶斯定理计算出的标准值之间差的绝对值作为判断被试估计准确性的指标,距离越小,表明被试估计准确性越高。认知反思能力高的被试和认知反思能力低的被试在三种信息表征下贝叶斯推理估计准确
对认知反思能力高分组和低分组在三种信息表征下的后验概率和标准值之间差的绝对值进行2×3方差分析,结果表明,信息表征主效应显著(F(2,170)=4.581,p<0.05);认知反思能力主效应显著(F(1,170)=5.24,p<0.05);信息表征和认知反思能力的交互作用显著(F(2,170)=3.56,p<0.05)。对信息表征进行多重比较。
结果发现,概率表征和频数表征之间的差异在0.05水平上达到统计显著性(p<0.05);概率表征下的成绩差于概率加树图表征下的成绩,但是两者之间也没有达到统计上差异显著性水平(p>0.05);频数表征和概率加树图表征之间差异达到临界显著水平(p=0.06)。
此外,由于信息表征和认知反思能力的交互作用显著,进一步对交互作用进行简单效应检验以此探测不同认知反思能力个体在各种信息表征条件下的推理表现。结果表明,在概率表征下,认知反思能力主效应不显著,F(1,172)=2.88,p>0.05;在自然频数表征下,认知反思能力的主效应极其显著,F(1,172)=9.59,p<0.01,认知反思能力越高的被试,其估计准确性越好;在概率加树图表征下,认知反思能力主效应显著,F(1,172)=4.04,p<0.05,认知反思能力越高的被试,其估计准确性越好。
为了检验贝叶斯促进效应在不同认知反思能力个体之间是否存在差异,对两组被试都比较概率信息表征下和自然频数信息表征下贝叶斯推理估计准确性的差异,采取独立样本t检验,由结果可知,对于认知反思能力低分组的被试而言,概率信息表征下和自然频数信息表征下的估计准确性之间没有显著差异,t=0.299,df=40,p>0.05,即不存在显著的贝叶斯促进效应;对于认知反思能力高分组的被试而言,概率信息表征下和自然频数信息表征下的估计准确性之间差异显著,t=4.103,df=53.54,p<0.01,也就是认知反思能力高分组的被试存在显著的贝叶斯促进效应。结果表明贝叶斯促进效应存在个体差异。
3讨论
首先,本研究的结果支持嵌套集合理论,即能够使嵌套集合关系显性化的表征方式都可以促进概率判断,而不仅仅只是自然频数形式能够促进任务中集合“嵌套”关系的显化。具体地,与经典的概率表征相比,概率加完整树图表征和自然频数表征对贝叶斯推理成绩都有促进。这也在一定程度上说明问题情景结构的重要性。格式塔心理学家认为问题解决是形成问题情景新的结构即把握问题情境中诸事物关系的过程(王甦,汪安圣,1992)。因此,由于进行貝叶斯推理时被试需要利用较多的认知资源,通过复杂的认知加工过程建构问题结构空间,而人的认知资源有限,之后再要做出正确的后验概率估计显然非常困难(史滋福等,2006)。而自然频数和概率加完整树图的表征在一定程度上明晰了问题情景中诸集合之间的关系,因而减轻了被试的加工负荷,使他们将注意、记忆和思维等心理资源集中在推理上,从而得到更符合贝叶斯推理规则的估计值,从而验证了嵌套集合假设,而且与“嵌入集将概率结构视觉化后大幅度提高了推理成绩”(Yamagishi,2003)的结论相似。
贝叶斯促进是很多研究者都认同的一种现象,但对于贝叶斯促进的普遍性一直存在质疑。以往研究表明贝叶斯促进效应的发生需要一定程度的数学运算能力。另一项研究(史滋福等,2006)研究表明叙述理由引发的元认知监控可以显著促进推理成绩。而本研究结果表明贝叶斯促进效应在认知能力不同的个体之间确实存在个体差异,这和本研究假设相符合。这些研究都说明理解和操纵自然频数需要一定程度的认知能力,只有一定认知能力的被试才有贝叶斯促进效应的发生。而根据嵌套集合理论,贝叶斯促进效应与认知反思能力相关,在认知反思能力不同的个体之间也应存在个体差异。所以本研究结果不仅支持本研究假设,也是支持嵌套集合理论观点的。
4结论
本文从认知加工的角度通过探讨认知反思能力和信息表征对贝叶斯推理的影响,来探讨自然频数促进效应的个体差异,研究结果表明①在认知反思能力不同的个体之间,贝叶斯推理的促进效应确实存在个体差异;②认知反思能力的主效应显著,信息表征主效应显著,认知反思能力和信息表征对贝叶斯推理估计准确性影响的交互作用显著;③在概率加树图表征信息表征和频数表征下,随着认知反思能力越高,贝叶斯推理的估计准确性越高,这在一定程度上说明树图表征将题中嵌套集合结构显现出来,诱发了分析过程。这些结果都支持嵌套集合理论。
今后的研究可以考虑将认知反思能力和运算能力、任务复杂性等结合在一起探讨其对贝叶斯推理促进效应的影响,从多方面综合地考虑促进效应的个体差异,进一步探讨贝叶斯推理促进效应的机制。
参考文献:
[1]史滋福,邱江,张庆林.明确嵌套集合关系对贝叶斯推理的促进效应.心理学报.2006,38,833–840.
[2]史滋福.贝叶斯推理问题解决中的认知偏向研究.博士研究生学位论文.西南大学.2007.
[3]史滋福,王香香,陈姣,张庆林.贝叶斯推理研究的三个层次.心理科学进展.2010,18,230–236.
[4]王甦,汪安圣.认知心理学.北京:北京大学出版社.1992.
作者简介:
杨希(1990—),女,汉族,湖南省常德市,硕士,湖南师范大学教育科学学院,基础心理学。
通讯作者:史滋福。
本研究得到湖南省社会科学基金项目:贝叶斯推理中概率信息的作用机制:行为与ERP研究(13YBA217)和湖南省教育厅重点项目:基于“三重加工心智模型”的青少年概率推理的认知机制研究(16A143)的资助。
关键词:贝叶斯推理;自然频数促进效应;认知反思能力
日常生活中人们经常会根据不确定信息来做出决策和判断。而且随着思考者年龄的增长,这类判断变得越来越重要(Fisk,2005)。贝叶斯推理正是在已知基础比率的情况下,利用击中率和误报率对该信息进行调整并做出判断的过程(史滋福,王香香,陈姣,张庆林,2010)。研究发现,人们的贝叶斯推理并不完全遵循贝叶斯公式的计算过程,容易导致认知谬误(Cognitive illusion)(Kahnemen &Tversky,1972)。以Gigerenzer和Hoffrage(1995)为代表的自然频数假设(natural frequency hypothesis)认为,以频数格式代替概率格式对问题进行表征时,所谓的“认知谬误”就会消失。Sloman,Over,Slovak和Stibel (2003)将这种在自然频数条件下对贝叶斯推理普遍促进的现象称为贝叶斯促进(Bayesian facilitation)。
近年来,有关贝叶斯促进已达成共识,但对其解释仍存在分歧:生态理性框架(Ecological Rationality Framework)认为人们平时所遇到的问题都是频数形式的信息,因此,人们的心智适应于频数形式,非频数形式倾向于导致较低的推理成绩(Cosmides&Tooby,1996)。而嵌套集合理论(Nested Sets Theory)认为频数的促进效应是由于自然频数的表征使集合的“嵌套”关系形象化了(Meller & Mcgraw,1999;Sloman,et al.,2003;Zhu & Gigerenzer,2006;Lesage,Navarrete,&De Neys,2013等)。为此,Barbey和Sloman(2007)进一步从推理双过程的角度予以阐释,自然频数格式使嵌套集合结构更加突出,从而诱发了分析系统,导致推理者在收集执行资源后得出正确答案。而在概率格式中,由于集合表征模糊,分析系统没有得到诱发,推理者无法正确应用规则,只能通过启发式系统,最终导致有偏差的答案。史滋福、邱江和张庆林(2006)结果发现:完整和不完整的树图表征,有助于明确嵌套集合关系,显著地促进了推理成绩。这也从另一个侧面证明了嵌套集合关系明确对贝叶斯推理的促进效应。
此外,研究者对频率促进效应的普遍性也存在分歧。如Chapman和Liu(2009)利用贝叶斯推理的“医学问题”和“汽车问题”进一步研究频率促进效应的普遍性。结果发现,理解和操纵自然频率需要一定程度的数字运算能力,只有数字运算能力测试上获高分的被试才发生频数表征促进效应。这说明频数促进效应并不是普遍现象,它仅适用于某种类型的推理者。考虑到另一项研究(史滋福等,2006)表明叙述理由引发的元认知监控也可以显著地促进推理成绩。而认知反思能力作为一种抑制错误直觉的倾向,是反映认知加工中个体差异的一个重要成分(Frederick,2005)。基于此,似乎有必要从个体差异的角度来寻求贝叶斯促进的机制。本研究假设认知反思能力高的个体更容易监控自己的思维,调整认知偏向,在自然频数和树图表征下推理成绩更好。
另外,对贝叶斯促进的认知过程,生态理性框架和嵌套集合假设理论二者对一般认知资源对贝叶斯促进的作用持相反态度。为此,本研究的整体思路是检验认知反思能力在自然频数表征、概率加完整树图、概率表征三种条件下的表现,进一步厘清促进效应产生的条件和机制。本研究假设,不同认知反思能力个体的贝叶斯促进的程度不同;自然频数和概率加树图表征都诱发了推理者的分析过程,从而表现出好于概率形式下个体的推理成绩;认知反思能力与信息表征对贝叶斯推理成绩的影响的交互作用显著,具体表现为,高认知反思能力的推理者在自然频数和树图表征下的贝叶斯推理成绩较低认知反思能力者的要好,而在概率形式下与低认知反思能力个体不存在差异。
1研究方法
1.1被试
某省三所高校随机抽取265名大学生(其中文科136人,理科129人),均不熟悉貝叶斯规则,平均年龄20.04岁。
1.2实验材料
1.2.1认知反思测验(Cognitive Reflection Test)
CRT用于测量一般执行认知能力差异(general executive cognitive capacity),反映被试抑制自发的但不正确答案的能力,曾在推理和决策的研究中多次用到(Evens,2010)。CRT是智力广度和执行功能测验的指标,也是对各种推理任务中表现的测量指标(Frederick,2005;Toplak,West,& Stanovich,2011),其与WPT和ACT的相关系数分别为0.43和0.46(Lesage,et al.,2013),该问卷的克伦巴赫系数α=0.61(Sirota,Juanchich,&Hagmayer,2014)。
1.2.2贝叶斯推理材料
采用经典的乳癌问题作为实验材料,并以概率、自然频数、概率加树图表征三种信息表征来表述。
1.3实验设计
本研究采用2(认知反思能力:高认知反思能力/低认知反思能力)×3(信息表征:概率/自然频数/概率加树图)的被试间设计。因变量为后验概率估计准确性(以后验概率估计值与使用贝叶斯定理计算出的标准值两者之差的绝对值为指标),绝对值差异越大,估计准确性越差。 1.4实验程序
利用上课时间集体测试,将三种实验材料与CRT装订成册,按照1∶1∶1的比例混合随机分发给被试。被试理解实验任务的要求后开始完成后面的实验任务,提醒被试独立完成,随后将材料收回,完成任务大约需要10分钟。
2结果分析
剔除没有按要求完成的24份,有效被试241人。将有效答卷的数据输入计算机,运用SPSS19.0统计软件包进行处理。结果如下:
2.1认知反思能力的基本情况和分类
CRT平均得分为2.237,标准差为0.879。参照以往研究(Frederick,2005)把CRT中得分为3的被试(即完全答对的被试)归为认知反思能力高分组,得分为0和1的被试归为认知反思能力低分组。该分类和Sirota等人(2014)、Lesage等人(2013)、Sirota和Juanchich(2011)的研究中的分类也相似。对两组CRT的得分进行独立样本t检验,差异极显著(t(57)=-44.939,p<0.01),说明这种分类有效。
2.2认知反思能力和信息表征对贝叶斯推理估计准确性的影响
以被试的后验估计值与使用贝叶斯定理计算出的标准值之间差的绝对值作为判断被试估计准确性的指标,距离越小,表明被试估计准确性越高。认知反思能力高的被试和认知反思能力低的被试在三种信息表征下贝叶斯推理估计准确
对认知反思能力高分组和低分组在三种信息表征下的后验概率和标准值之间差的绝对值进行2×3方差分析,结果表明,信息表征主效应显著(F(2,170)=4.581,p<0.05);认知反思能力主效应显著(F(1,170)=5.24,p<0.05);信息表征和认知反思能力的交互作用显著(F(2,170)=3.56,p<0.05)。对信息表征进行多重比较。
结果发现,概率表征和频数表征之间的差异在0.05水平上达到统计显著性(p<0.05);概率表征下的成绩差于概率加树图表征下的成绩,但是两者之间也没有达到统计上差异显著性水平(p>0.05);频数表征和概率加树图表征之间差异达到临界显著水平(p=0.06)。
此外,由于信息表征和认知反思能力的交互作用显著,进一步对交互作用进行简单效应检验以此探测不同认知反思能力个体在各种信息表征条件下的推理表现。结果表明,在概率表征下,认知反思能力主效应不显著,F(1,172)=2.88,p>0.05;在自然频数表征下,认知反思能力的主效应极其显著,F(1,172)=9.59,p<0.01,认知反思能力越高的被试,其估计准确性越好;在概率加树图表征下,认知反思能力主效应显著,F(1,172)=4.04,p<0.05,认知反思能力越高的被试,其估计准确性越好。
为了检验贝叶斯促进效应在不同认知反思能力个体之间是否存在差异,对两组被试都比较概率信息表征下和自然频数信息表征下贝叶斯推理估计准确性的差异,采取独立样本t检验,由结果可知,对于认知反思能力低分组的被试而言,概率信息表征下和自然频数信息表征下的估计准确性之间没有显著差异,t=0.299,df=40,p>0.05,即不存在显著的贝叶斯促进效应;对于认知反思能力高分组的被试而言,概率信息表征下和自然频数信息表征下的估计准确性之间差异显著,t=4.103,df=53.54,p<0.01,也就是认知反思能力高分组的被试存在显著的贝叶斯促进效应。结果表明贝叶斯促进效应存在个体差异。
3讨论
首先,本研究的结果支持嵌套集合理论,即能够使嵌套集合关系显性化的表征方式都可以促进概率判断,而不仅仅只是自然频数形式能够促进任务中集合“嵌套”关系的显化。具体地,与经典的概率表征相比,概率加完整树图表征和自然频数表征对贝叶斯推理成绩都有促进。这也在一定程度上说明问题情景结构的重要性。格式塔心理学家认为问题解决是形成问题情景新的结构即把握问题情境中诸事物关系的过程(王甦,汪安圣,1992)。因此,由于进行貝叶斯推理时被试需要利用较多的认知资源,通过复杂的认知加工过程建构问题结构空间,而人的认知资源有限,之后再要做出正确的后验概率估计显然非常困难(史滋福等,2006)。而自然频数和概率加完整树图的表征在一定程度上明晰了问题情景中诸集合之间的关系,因而减轻了被试的加工负荷,使他们将注意、记忆和思维等心理资源集中在推理上,从而得到更符合贝叶斯推理规则的估计值,从而验证了嵌套集合假设,而且与“嵌入集将概率结构视觉化后大幅度提高了推理成绩”(Yamagishi,2003)的结论相似。
贝叶斯促进是很多研究者都认同的一种现象,但对于贝叶斯促进的普遍性一直存在质疑。以往研究表明贝叶斯促进效应的发生需要一定程度的数学运算能力。另一项研究(史滋福等,2006)研究表明叙述理由引发的元认知监控可以显著促进推理成绩。而本研究结果表明贝叶斯促进效应在认知能力不同的个体之间确实存在个体差异,这和本研究假设相符合。这些研究都说明理解和操纵自然频数需要一定程度的认知能力,只有一定认知能力的被试才有贝叶斯促进效应的发生。而根据嵌套集合理论,贝叶斯促进效应与认知反思能力相关,在认知反思能力不同的个体之间也应存在个体差异。所以本研究结果不仅支持本研究假设,也是支持嵌套集合理论观点的。
4结论
本文从认知加工的角度通过探讨认知反思能力和信息表征对贝叶斯推理的影响,来探讨自然频数促进效应的个体差异,研究结果表明①在认知反思能力不同的个体之间,贝叶斯推理的促进效应确实存在个体差异;②认知反思能力的主效应显著,信息表征主效应显著,认知反思能力和信息表征对贝叶斯推理估计准确性影响的交互作用显著;③在概率加树图表征信息表征和频数表征下,随着认知反思能力越高,贝叶斯推理的估计准确性越高,这在一定程度上说明树图表征将题中嵌套集合结构显现出来,诱发了分析过程。这些结果都支持嵌套集合理论。
今后的研究可以考虑将认知反思能力和运算能力、任务复杂性等结合在一起探讨其对贝叶斯推理促进效应的影响,从多方面综合地考虑促进效应的个体差异,进一步探讨贝叶斯推理促进效应的机制。
参考文献:
[1]史滋福,邱江,张庆林.明确嵌套集合关系对贝叶斯推理的促进效应.心理学报.2006,38,833–840.
[2]史滋福.贝叶斯推理问题解决中的认知偏向研究.博士研究生学位论文.西南大学.2007.
[3]史滋福,王香香,陈姣,张庆林.贝叶斯推理研究的三个层次.心理科学进展.2010,18,230–236.
[4]王甦,汪安圣.认知心理学.北京:北京大学出版社.1992.
作者简介:
杨希(1990—),女,汉族,湖南省常德市,硕士,湖南师范大学教育科学学院,基础心理学。
通讯作者:史滋福。
本研究得到湖南省社会科学基金项目:贝叶斯推理中概率信息的作用机制:行为与ERP研究(13YBA217)和湖南省教育厅重点项目:基于“三重加工心智模型”的青少年概率推理的认知机制研究(16A143)的资助。