语言测试构念效度研究

被引量 : 14次 | 上传用户:honest1988li
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
2005年的英语专业八级考试是根据2004年新的八级考试大纲设计和施测的第一次考试,考试的性质、构念领域、任务要求、分数权重等都发生了较大变化。作为全国唯一的测量英语专业学生高年级英语水平的大规模考试,这些变化对个人、团体和社会将产生重大影响。测试界认为,越是高风险考试,越要对考试的技术和应用方面进行评价,对考试的效度验证要求越高。因此,运用先进的效度理念、分析技术和行业规范对我国的八级考试进行研究,不仅有理论价值,也具有现实意义。在对测验的评价中,效度是最重要的考虑因素。然而,在过去近一个世纪以来,效度的概念从多类效度发展到统一构念效度。与效度概念发展相联系,效度验证的范式和方法也产生了变化。因此,全面和准确地理解效度,具有十分重要具有理论意义。而掌握效度验证的科学方法具有运用价值。 本研究的目的有二:一是对统一效度概念从本体论、认识论、方法论视角进行较全面的评述,旨在为八级考试效度验证提供一个理论和方法框架;二是在统一效度概念下,对八级考试的客观试题从实证的角度进行效度验证。验证的问题包括四个:八级考试客观试题的测量学属性如何?客观题目实际测量的维度与考试设计的理念是否一致?客观试题分数的意义在不同的群体中是否具有类似的解释?新增加的人文知识分测验在是否存在考试偏差? 针对两个目的,采用两种研究方法。对构念效度的理论和方法讨论采用文献综述方式;针对八级考试客观题目的效度验证是用定量的方式提供解释依据。 构念一致性问题是本研究中关于分数解释的切入点,解决的是测验所测量的构念在不同背景的考生的意义是否具有可比性问题。当一个测验在一个组别(群体)中所测量的假设特质(或者心理构念)与另一组别相同,或者当一个测验在测量相同的特质而测量的准确程度相似时,构念具有可比性。构念一致属于分数结构和效度概化问题。它与考试偏差分析一起,为分数的可解释性和考试公正提供依据。 本研究的对象是446所大学参加2005年TEM 8考试的96696名考生。分析的数据是由上海外国语大学四、八级考试中心提供的全体考生在客观题目上的原始反应数据以及已经对反应进行判断过的数据。针对不同的研究问题,使用了不同的统计分析手段:描述统计用于基本数据探索;相关方法分析题目同质性、题目区分度、聚合和区别效度、构念一致性检验;因子和谐系数用于检验不同群体因子负荷之间的相似程度;单因素方差分析进行跨群体均值比较;因子分析用于因子维度探索和验证;标准
其他文献
语文学习主体性的培养是新时代的呼唤,是语文教育特殊性的要求,是国家基础教育课程改革的目标要求。可是当我们把目标移向中学语文教学实际进行一番审视之后就会惊讶地发现:
【正】 国务院提出要把杭州建设成为我国东南部的旅游中心和世界第一流的风景旅游城市以后,随着旅游事业的发展,人们对杭州西湖的关心与日俱增,各方面、各部门、各学科都在探
先秦时期,以孔子、孟子为代表的儒家先哲关于“德治”的主张,以及“大学之道,在明明德”的观点,表现出对教育的高度重视和推崇。在教育内容上,这些学者注重礼、乐、仪、文等文化内
改革开放以来,我国体育事业逐渐蓬勃发展,多项竞技体育运动在国际赛场上屡屡夺魁,体育文化产业市场经营开始形成。与此相应的是,近几年全国各地涌现了一大批专业性的体育报刊,而综
随着近年来国际国内社会对于知识产权保护和立法的重视,知识产权制度越来越受到人们的关注。从立法层面上看,我国知识产权立法水平已经达到了依据国际条约应当承担的义务标准。
本文从人的全面和谐发展的人文观点出发,结合当前高师音乐教育改革的实际,运用国内外的各种评价理论和教学观点,采用教育心理学的评价模式,分三章探讨高师声乐评价模式,按照
随着社会经济的发展、社会对人才的需求和应试教育的反思,具备一定的专业知识,具有创新思维能力和健康心理素质的综合型人才成为社会各行各业的渴望。而生命科学作为21世纪的领
针对液压材料试验机运行过程的出现的精度不高、系统不稳定等问题,对该电液位置伺服系统进行了研究。首先建立了电液位置伺服控制系统的数学模型,运用Ziegler-Nichols传统PID
<正>1为不断变化的格局奠定坚实的基础测试和保障历来是电信服务的基石,在5G时代尤为重要。5G带来的是令人目眩的高速、巨大的覆盖范围、超高的密度和容量、超高的可靠性和极
本文以调查数据为基础,分析了手机游戏对大学生群体的正面、负面影响,探讨了手机游戏如何根据大学生群体的需要调整发展模式。