基于测试使用论证的听力理解任务效度研究

来源 :上海外国语大学 | 被引量 : 14次 | 上传用户:fffdsa4te
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
一项完整的测试工作不仅包括测试的设计开发而且包括对测试结果的阐释和使用,论证其合理性和公正性。从事后研究角度讲(ex post facto study),测试工作者不仅要证明测试的有效性,而且要证明测试使用环节的公正性(Bachman,2005),因此任何角度的研究所收集的任何证据都是为了证明测试的效度(Messick,1989;Shohamy & Inbar,1991)。本研究选取任务特征作为切入点探讨测试的效度。已有研究探讨了影响测试效度的具体任务特征,但却没有涉及任务特征与测试构念的联系,更没有涉及基于任务表现所做决策的公正性问题。本研究以TEM4听力理解项目(2005-2008)作为研究对象,借鉴Bachman(2005)的测试使用论证模式,从任务特征角度分析影响英语专业听力理解效度的任务特征;剖析这些特征与听力理解构念的联系;解析基于听力理解任务表现所做决策的公正性。首先,本研究从2005-2008年的测试成绩中随机抽取10%的数据,采用验证性因子分析方法,从听力项目材料的体裁视角分析听力理解测试的构念效度,探讨不同年份的试题是否具有可比性,为任务特征分析做铺垫。结果表明四年的听力理解项目的构念相同,具有很强的可比性。会话部分的题目对听力理解的贡献值介于0.95-1;短文部分的项目对听力理解的贡献值介于0.95-1;新闻部分的项目对听力理解的贡献值介于0.88-0.97。会话、短文和新闻之间的联系非常紧密,其相关系数介于0.82-0.99。接着,本研究将四年的听力项目成绩的难度参数(Rasch)做Z分数标准分转换,分析任务特征与项目难度的联系。Spearman非参数双侧检验的相关分析表明共有19个任务特征与听力试题的难度显著相关:文本特征7个,题目特征4个,文本和题目交互特征8个。逐步迭代回归分析显示由自变量推理题、干扰项关键词和文本关键词匹配、文本词汇密度、答案长度、文本状语从句数等特征构成的模型对听力理解难度的预测能力最强。模型回归系数为0.663,回归系数的平方为0.439;即是说,该模型能预测43.9%的题目难度方差。预测指标按标准化回归系数大小排列依次为推理题、干扰项关键词和文本关键词匹配、文本词汇密度、答案长度、状语从句数。基于结构方程模型的回归分析也得出相似结果:题目因素对任务难度的影响很小,而文本及文本相关因素对任务难度的影响大于题目因素,并且文本和题目交互因素的影响最大。本研究还探讨了不同体裁的题目难度的预测指标。会话题目难度的预测指标只有一个:推理题,能够解释45.8%的题目难度方差。短文题目难度的预测指标有两个:干扰项关键词和文本关键信息匹配、推理题,能够解释39.1%的题目难度方差。新闻理解难度的预测指标有三个:推理题、关键信息音节数、题干关键词和文本关键词匹配,能够解释50.7%的题目难度方差。三种体裁的题目难度分析显示,题目特征对难度的影响很小,体裁越复杂,题目因素对难度的影响越小,文本和题目交互因素的影响越大。本研究采用探索性因子分析方法和验证性因子分析方法探讨了任务特征与任务难度的联系,任务特征与听力理解测试构念的联系,以及基于任务特征的测试构念与难度的联系。首先,采用探索性因子分析方法得出共有13个任务特征组成了三个因子:文本因子(6个任务特征)、题目因子(3个任务特征)和认知活动因子(4个任务特征)。回归方程模型显示认知活动因子对任务难度的影响最大,文本次之,题目特征的影响最小。回归方程的决定性系数R平方非常理想,充分说明了三个任务特征因子对题目难度有很强的解释力度。验证性因子分析结果显示认知活动因子的方差能够100%由听力理解这一构念来解释,文本特征因子能够被听力理解所解释的方差可以忽略不计,而题目特征大约有8.4%的方差能由听力理解这一构念所解释。这说明TEM4听力理解项目是基于文本和题目交互因素的认知活动过程,单一的文本因素并不构成听力理解,但是事先预览题目或许会对听力理解构念造成轻微的影响。回归模型表明由13个任务特征所构建的听力理解测试构念与任务难度密切联系,回归方程的决定性系数R平方非常理想,说明本研究的听力理解测试构念建构非常理想,对题目难度有很强的解释力度。在验证听力测试有效性的基础上,本研究探讨了标准参照理论框架下基于任务表现的决策公正性问题。Rasch模型的测验信息函数表明2005-2008年的听力理解测验信息量比较满意,能够很好地诊断考生的听力理解水平。不同听力理解水平的考生具有明显不同的听力理解技能。除2005年以外,其他三年的考生听力理解表现相对保持稳定。根据教学大纲和决策可靠性系数的要求,除2006年以外,70%的分数线(答对21道题目)具有良好的可靠性,能相对有效地保证决策的公正性。整体而言,过关组考生具备了很好的会话、短文和新闻理解能力,能有效地理解信息。优生(答对率为80%及以上)除了具备中等生和差生的能力外还具备核对各类体裁中的各种信息并识别其关系、理解日常会话中的隐含语用信息、理解特定文本(如导游词)中短语的含义、掌握国际新闻的主旨大意等能力。中等生(答对率为60%-70%)除具备差生的能力外还具备理解日常会话(如校园话题、就业面试等)、短文(如学术和文化话题)、以及国内新闻中的隐含信息、理解所谈话题、识别特定文本(如导游词)中明确信息的关系等能力。差生(答对率低于60%)具备基本理解各种体裁和话题的明确信息、核对并识别明确信息关系、大体领会国际新闻和非学术讲座的话题等能力,并且具备一定的推理能力。
其他文献
振兴民族的希望在教育,特别是基础教育。振兴基础教育的希望在广大中小学教师;师德建设是提高中小学教师整体素质的关键,也是教育发展的灵魂。中小学教师职业道德关系到我国
介绍了陶瓷过滤机的结构和工作原理,根据测试结果分析了陶瓷过滤机在不同转速下处理精矿时的生产能力,并就给矿浓度和给矿粒度对生产能力的影响进行了分析。
目的:分析对老年高血压患者实施优质护理服务的效果及临床价值。方法:在2017年4月-2018年11月间入院接受治疗的高血压患者中选择100例老年病患作为研究对象,所有患者均为自愿
一、史前时期:新石器时代一般所谓"桃",即指普通桃.桃的野生种即指普通桃的野生种,通指毛桃及其近缘种.毛桃来自光核桃,光核桃今日见于西藏、川西、滇北.光核桃并非全为光核,
在蘑菇湖水库近10年水质资料的基础上,分析了水库的污染现状,并采用内梅罗污染指数法进行评价,评价结果表明,蘑菇湖水库属于五级重污染;对水库进行富营养评价、分析结果表明,
对蘑菇湖水库主要污染源和水库水质现状进行调查评价,分析表明蘑菇湖水库污染严重,已失去养殖功能。为减少水库纳污量,控制水体进一步受到污染,提出治理措施和建议:石河子造
油井动液面数据直接反应了地层的供液情况及井下供排关系,是进行采油工艺适应性评价和优化的重要依据,但连续监测困难。以沉没压力作为共同的求解节点,分析柱塞承受载荷的变
随着社会的进步和发展,人们对于食品安全方面更加重视。"无公害"植物适应了当前社会的发展潮流,因此无公害的食物被青睐和信任。无公害茶叶作为一种对于人类营养保健良好的消费
学生的班级归属感是一个学校生存的关键,也是学生前途命运的制胜法宝。班级归属感的形成需要多方面的力量,来自家庭的、社会的,还有学校的、老师的以及学生自身的,这些环节缺
针对回转窑煅烧温度接触式测温方式中由于窑体转动引起的测量值的波动问题,提出采用基于经验模态分解的滤波算法来解决。利用固有模态函数的窄带性和频率递减性分别设计了离线