瑞文测验项目认知难度因素分析及LLTM拟合验证

来源 :心理与行为研究 | 被引量 : 0次 | 上传用户:denny322
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要该文在以认知和测量相结合为特征的新一代测验理论的指导下,针对项目刺激特征,对影响瑞文测验项目认知难度的因素进行了分析,提取出图块繁简度、整体布局、变化维度和题序等4个因素,然后应用线性逻辑潜在特质模型(LLTM)对这四个因素进行了拟合检验,结果证明提取出的四个因素是有效的。文章还进一步探讨了研究结果在智力测验中的应用。
  关键词新一代测验理论,认知难度因素,潜在特质模型。
  分类号G449
  
  1问题提出
  
  传统的智力测验[1],由于缺乏心理学实质理论作基础,其效度无法从根本上得以验证,受到人们较多的质疑与批评[2]。为了探求智力的本质,20世纪六、七十年代以来,一些著名的心理学家致力于“将智力视作认知过程来重构智力概念”[3]的工作,并且已取得了一些进展,但用以这种理论为基础的测验取代现有的智力测验还为时过早。传统的智力测验,尽管没有全面解释智力的本质,终究是对智力的再次表现,被试求解测验项目,也终究是一种智能活动。从被试在这些智能活动中的表现,也可评估被试的智力水平,只不过这种评估较为模糊、较为笼统而已。因此,传统的测验在诸多批评中依旧得到广泛的使用。既然“将智力视作认知过程来重构智力概念”在目前还有一定难度,那当前之计就是将智能活动视作认知过程来进行分析,以深入理解人的智能特征。时下国内外研究文献中对智能活动作认知分析通常采用两种方法:其一,分析测验项目解决的认知加工成分、策略、所需知识结构等被试内部微观的心理机制。其二,分析测验项目的刺激特征对项目难度的影响。有了对智能活动的认知分析结果后,如果还能引入合适的测量模型对这类分析给予量的刻画,使认知分析结果能获得测量数据的实际验证,就能对测量作更有效的解释。这就是认知心理学与现代测验理论的结合,是新一代测验理论的核心思想[2]。
  在各种传统智力测验中,瑞文标准推理测验(下简称瑞文测验)以其适用范围广、使用方便以及结果解释直观、简单等优点得到了广泛的使用。本研究采用分析项目刺激特征的方法分析瑞文测验项目认知难度的影响因素,以便为更深入解释瑞文测验结果、分析被试智能特征提供依据。具体的做法是:首先对被试解答项目的认知过程进行详细分析,提出影响因素及其层次结构假设。其次引入合适的测量模型,通过对实测数据的拟合与检验来验证假设是否成立。
  本研究所选的测量模型是项目反应理论中的线性逻辑斯蒂克潜在特质模型(linear logistic latent trait model,LLTM)。线性逻辑潜在特质模型是费舍(Fisher)在拉希(Rasch)模型的基础上进行扩充、改造而成的,其数学表达式为:
  
  式中, 为被试能力,bi*为试题难度,qim是项目i在因素m上的难度计分,是因素m的难度权重,d是标准化常数。可以看到模型中项目难度是各影响因素的线性组合。
  
  2研究方法与步骤
  
  2.1认知难度影响因素及其层次结构假设的提出
  2.1.1方法
  选取了67名被试(其中大学生34名,初中生15名,小学生18名)进行瑞文测验的施测。测试个别进行,除了正常作答,还请被试在解题过程中口头报告其思维过程,测试后被试还回答了主试的“做这个题目你是怎么想的?”、“你认为这个题目难吗?难在哪?”等一系列有针对性的提问。主试对被试的口头报告及回答均作详细记录,然后整理、概括,提出初步的假设;再与一些认知心理学教授和美术工作者就假设中的因素个数、因素名称与定义作进一步的分析、论证,形成最后的因素结构假设。
  2.1.2因素结构假设
  因素一图块繁简度
  图块指每一测验项目中的各个单元图形,瑞文测验中每一个项目含有数目1至8个不等的图块。图块繁简度即指图块中的基本元素数量的多寡及基本元素组合方式的复杂程度。瑞文测验的图块中的基本元素包括点、线、圆、三角形、斜条纹等。图块繁简度可分为4个层次,分别赋值1、2、3、4。所赋数值越大表示繁简度越大。
  1为单种或多种元素平铺。指整个项目中含有的基本元素均匀分布,如项目A4等。
  2为多元素两两简单组合。指整个项目中含有多种不同的基本元素,但其中的每个图块只由两种基本元素简单组合而成,如项目D5等。
  3为多元素多重简单组合。指整个项目含有多种基本元素,其中至少有1个图块由2种以上基本元素简单组合,如项目E10等。
  4为多元素复杂组合。指整个项目中含有多种基本元素且图块由基本元素复杂组合。所谓复杂组合指不同元素的重叠、交叉等组合形式,如项目C8等。
  因素二图块整体布局
  即构成瑞文测验项目的各图块间的相互关系。瑞文测验项目图块的布局有简单布局、拉丁方布局、无剔除的套合布局、有剔除的套合布局4个层次,分别赋值0、1、2、3。
  0为简单布局。包括均匀、渐变、轴对称3种布局方式。均匀,即项目中的图块均为同一图案且均匀分布,如项目B2等。渐变,即项目中的图块从左至右,从上至下大小或数量等发生变化,如项目C3等。轴对称,这种布局出现在有4个图块的项目中。即左右图块间及上下图块间是轴对称的,如项目B3等。
  1为拉丁方布局。指在N行、N列的图块排列中,有N个不同的图块,每个图块在每行中仅出现1次,在每列中也仅出现1次,如项目D2。
  2为无剔除的套合布局。即前一列(行)或中间一列(行)或最后一列(行)图块是另两列(行)图块的叠加,如项目E2。
  3为有剔除的套合布局。即前两列图块叠加后,经某种剔除(或是将相同的元素剔除,或是将不同的元素剔除)而形成第3列图块,如项目E10。
  因素三变化维度数
  在瑞文测验中,图块间可能会有朝向、形状、数量、位置、大小等形式的变化。变化维度数指项目图块间发生了几种形式的变化。瑞文测验中图块间变化维度数最多的项目为3,故分别赋值0、1、2、3。题例分别如B1、C7、B7、C8。
  因素四题序因子
  瑞文测验项目分为A、B、C、D、E五大类,每一类都有一个主题。瑞文测验的指导手册中提到“一般来说,完成前面的题目对解决后面的题目有帮助,……这正是题目排列的用意所在。”[4]也就是说,被试在解答项目时有学习效应。因此,项目所在位置,即题序也被认为是影响项目难度的因素。题序因子的量值的给定方法为每个项目本身的代号去掉英文字母。如项目A11,就用11表示它的题序因子。
  需要说明的是,D11、D12、E11、E12四个项目有其特殊性,不能用上述因素假设理论分析。又因为数量很少,故本文未作研究。
  
  2.2各项目难度因素层次的赋值
  根据2.1.2的假设,分析每个项目的刺激特征并分因素赋值。结果如表1所示。
  2.3项目难度值估计
  评阅2.1.1中被试在瑞文测验上的测试结果,获得各项目上被试的做答反应矩阵,用自编的参数估计程序(联合极大似然估计)估计各项目难度值,结果见表2。2.4项目难度对影响因素的线性回归拟合方程的求取及回归检验
  2.4.1回归方程的求取
  把难度作为因变量,影响因素取值做为自变量,利用SPSS 10.0软件包求取难度在各影响因素上的线性回归系数。所得回归方程如下:
  
  2.4.2回归方程的有效性检验及决定系数
  对此回归方程进行方差分析的结果如表3所示。
  
  据此,所求回归方程是有效的。另可求得其决定系数为R2=0.664。对每个自变量进行显著性检验,p值分别为0.001、0.000、0.004、0.048,均低于0.05的显著性水平值。据此,我们完成了对瑞文测验项目认知难度因素及其层次结构假设的验证。
  
  3结果的潜在应用探讨
  
  3.1被试认知特征识别
  有了项目认知难度影响因素模型,就可以克服对个体的智力水平仅给一个总分值的简单做法,个体的能力特征可参照其答对或答错项目的因素取值作进一步的解释。如被试A答对瑞文测验项目37个,在A、B、C、D、E5组中,错答数分别为1、1、5、3、9个,被试A的错答主要在E组。比较E组各因素取值及其它组项目因素取值发现,E组项目在因素二上的取值明显高于其它组,因此可以说,被试之所以E组题答不好,是因为对图块整体布局这一影响因素反应能力较弱,也就是说被试知觉图块整体布局、对事物形成整体认识的能力较差,或是在知觉基础上进行有效推理的能力较差。
  另外,对传统智力测验简单评为能力水平相同的被试,也可据其解决的项目不同,进一步分析其间的能力结构差异。如被试B、C,答对瑞文测验项目数均为27个。他们的正答项在各影响因素上取值的平均数如表4所示。
  
  被试正确作答项在因素一、因素二、因素三上的平均取值越大就意味着被试在相应影响因素上的反应能力水平越高。从表4中可看出,被试B、C在因素一上的反应能力是相同的;在因素二上被试C强于被试B;在因素三上被试B强于被试C。被试正确作答项在因素四(题序因子)上取值高,说明被试在位置较靠后的题目上才出现学习效应,说明被试自觉学习能力更低,因此被试B在学习能力上强于被试C。
  
  3.2为计算机智能命题提供测量学理论基础
  实现计算机智能化命题是普及计算机化测验的一项重要技术。本文得到影响瑞文测验认知难度的四个因素,以及每个影响因素的权重,由此建立了项目的刺激特征参数向项目难度映射的关系。根据这个关系,我们可以编制出同时考虑图块繁简度、图块整体布局、变化维度、题序因子等因素变化的命题程序,计算机就可自动生成符合各因素层次要求的瑞文测验项目。另外,如果指定项目难度值,那么,计算机可根据项目的刺激特征参数向项目难度映射的关系法则分配项目在各影响因素上的取值,进而生成指定难度的项目。
  
  4需进一步探讨的问题
  
  本研究需进一步探讨的问题有:D11、D12、E11、E12四个项目的难度因素分析有待进一步探索;回归方程的剩余方差还不是很小,可能还有其它的难度因素未被找出;潜在应用前途中提出的智能命题仅是一个初步设想,有待完善和实践。
  
  参考文献
   1 张阔, 胡竹菁. 智力测验发展的现状与趋势. 心理学探新, 2002, (22)2: 36~40
   2 Frederiksen N, Robert J M, Isaac I B(Ed). Test Theory for a New Generation of Tests. Lawrence Erlbaum Associates, Inc. 1993
   3 李其维, 金瑜. 简评一种新的智力理论: PASS模型. 华东师范大学学报, 教育科学版, 1995, 4: 41~50
   4 张厚粲, 王晓平. 瑞文标准推理测验手册, 1980
  注:本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文
其他文献
摘要该研究主要考察7~12岁儿童视觉搜索能力的发展。实验结果表明:儿童视觉搜索能力随年龄的增长而提高,性别差异不显著;儿童对三种不同视觉刺激材料(阿拉伯数字、英文字母、汉字)的视觉搜索的反应时没有表现出明显的差异,这个结果与通常的一些实验结果不同。同时,儿童在视觉搜索过程中,判断刺激出现的反应时均明显短于判断刺激没有出现的反应时;两种判断与左右手之间存在着交互作用。  关键词视觉搜索,信息加工速度
期刊
教育部哲学社会科学重大课题攻关项目“青少年心理健康素质的调查研究”课题组自2003年12月25~26日召开开题会议后,于2004年5月11~12日在天津师范大学心理与行为研究中心召开第二次会议。  会议由课题首席专家沈德立教授主持。  出席会议的课题组成员有以下各位教授:张大均(西南师范大学)、江光荣(华中师范大学)、郑希付(华南师范大学)、沃建中(北京师范大学)、李虹(清华大学)、梁宝勇(天津师
期刊
摘要大脑皮层与内脏关系的脑机制是揭示心身疾病和心理疾病的重要依据。本文综述了经典条件学习与期待性恶心与呕吐的关系以及实验性恶心与呕吐的研究方法。作者认为,实验性恶心与呕吐结合脑成像技术是研究大脑皮层与内脏关系神经机制的重要途径。  关键词皮层—内脏关系,经典条件反射,期待性恶心与呕吐,实验性恶心与呕吐,脑影像。  分类号B845.1    长期以来,关于内脏活动的神经调节,公认的观点是其更多地受自
期刊
去年11月以来,SARS(severe acute respiratory syndrome)从广东开始蔓延,后扩展到香港、北京和华北地区。我国政府为了抵御SARS的肆虐,紧急救治广大SARS患者,在控制传染源、保护民众免受感染方面做了大量行之有效的工作,使SARS疫情在短期内基本得到了控制。在这场抗击SARS的斗争中,我国心理学界同其他有关学科领域一样,也积极行动起来并做出了自己独特的贡献。  
期刊
摘要运用自尊量表和背景资料调查问卷对甘肃省两大戒毒所242例吸毒女性进行测查,结果表明:(1)年龄、婚姻状况、文化程度、经济收入水平等因素与吸毒女性自尊评分无显著相关;(2)回归分析显示,人际关系因子对吸毒女性自尊评分有显著影响,认知、行为因子对其自尊评分的影响没有达到显著性水平;(3)文化程度不高,无固定的经济收入,失恋或离婚等因素是吸毒或吸毒成瘾的重要关联因素。  关键词毒品,自尊,吸毒女性。
期刊
摘要本研究的目的是编制适合中国社会文化特点和大学生使用的心理应激量表,并制订全国大学生常模。通过开放性问卷调查、对大学生心理咨询个案的分析和对高等学校心理咨询教师与专家的访谈以及参考国外同类量表的条目等方式编写条目,通过两次预测筛选、修改并确定量表的项目;在全国采用分层随机采样方式选取182所普通高等学校54708名大学生和研究生进行测试。结果表明,中国大学生心理应激量表具有相当高的重测信度、内部
期刊
摘要该研究旨在发展适合我国大学生适应状况的中国大学生适应量表(China College Student Adjustment Scale, CCSAS),文章详细介绍了量表的编制过程和它的心理测量学指标。首先在访谈并借鉴国外已有适应量表的基础上,初步确定了大学生适应的维度和项目。然后经过2次预试对维度和项目进行修改,得到一个包含7个维度共60个项目的中国大学生适应量表。采用分层按比例取样的方法抽
期刊
摘要本研究从天津市五所高校中选取336名大学生和44名教师,对他们在SARS流行时期对SARS的危险性认知、恐惧心理、行为特征以及他们对与SARS相关的事件的态度进行评估。结果发现:(1)大多数师生具有正常的行为方式和心理状态;(2)少数高校师生表现出一定的恐惧和忧虑。最后,根据本次研究结果作者提出了一些针对性建议。  关键词SARS,高校师生,心理和行为反应,天津市。  分类号B849:C91 
期刊
AbstractTwo lines of research on eye movements in reading are summarized. One line of research examines how adult readers identify compound words during reading. The other line of research deals with
期刊
摘要Markus认为不同的文化系统即个人主义与集体主义的文化将对应不同的自我结构:独立型自我和依赖型自我,而不同的自我结构可以解释预测个体在情绪、认知、动机等方面的差异。Markus等人的研究结果引人注目,同时也受到了相当多的质疑和批判。该文系统综述了这方面的情况。  关键词个人主义,集体主义,独立型自我,依赖型自我。  分类号B848    “自我”是心理学研究的一个重要内容。1890年,詹姆斯
期刊