多面RASCH模型在HSK(中级)口语评分检验中的应用

来源 :北京语言大学 | 被引量 : 9次 | 上传用户:sdddddddd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
主观性考试主要包括口语考试和作文考试,是语言水平考试的重要组成部分。由于主观性考试的评分主要依靠评分员的主观印象,因此有效控制评分员的质量是保证主观性考试质量的一个重要手段。当前控制主观评分质量的主要手段是,评分前,对评分员进行评分标准的培训;评分过程中,对评分结果进行抽查;评分之后,对各评分员评分结果的一致性进行检验。但培训效果如何,评分员评分的偏差具体出现在哪儿,应该指导评分员在哪方面改进,这些都不明确。近年来,国内外一部分研究者使用数学模型对评分员的评分结果进行分析,取得了初步的成绩。由于新近诞生的HSK(中级)口语考试所采用的评分体系是一个不连续的等级量表,不同于其他主观考试的评分体系。参照前人的研究成果,本研究尝试使用基于多面Rasch模型(Many Facet Rasch Model,简称MFRM)开发的FACETS软件对HSK(中级)口语考试的评分结果进行考察。主要针对评分员、评分员与考生的偏差和评分量表这个三个面进行分析。在研究过程中,我们使用MFRM对每位评分员的严厉度和信度进行了具体的估算和比较,分析了每位评分员在对特定考生评分的过程中产生偏差的具体原因,并提取出了异常分数。同时,本研究结果表明HSK(中级)口语考试的评分体系与MFRM拟合得非常好。我们希望本次研究能为HSK(中级)口语考试评分中评分员的选拔和培训提供具体的统计上的依据,促进MFRM在实际评分监控中的应用。
其他文献
‘无A无B”格式是现代汉语四字格中常见的一类形式,但就这一具体格式的研究并不多见。本文以这一格式作为研究对象,通过多角度考察,使我们对这个格式、对四字格都能有一个更
Deborah Schiffrin从话语出发,首先为话语标记语提供了操作性定义,认为话语标记语是依存于前言后语、划分说话单位的坐标。自从1987年她的《话语标记》一书发表以来,语言学界
本文研究的主要内容是利用当前环境污染物中大量存在的废弃PET聚酯材料制备水性涂料。通过查阅大量的文献资料,总结、分析前人研究的经验、数据和成果,在此基础上提出新的思
草根创新作为包容性创新的重要组成部分,更加强调草根群体对创新活动的主动参与以及自我价值实现。草根创新将包容性创新的研究思路从企业如何嵌入BOP市场拓展到探究草根作为
自20世纪70年代以来,学者们从不同角度对语码转换现象进行了大量研究,主要包括语法学、社会语言学、心理语言学、会话分析和语用学。相比之下,语用学的研究路向不仅在一个动
近年来,伴随着我国经济建设的发展和对外开放水平的增大,经济犯罪活动也顺势增加,由于国外的经济犯罪组织对我国经济犯罪活动的渗透,我国的洗钱犯罪行为所占比例上升。为了维
目的 观察生血宁片联合琥珀酸亚铁片治疗妊娠期缺铁性贫血的临床效果。方法 选取2015年2月至2016年10月太康县人民医院收治的76例妊娠期缺铁性贫血孕妇,依据治疗方式分组,各3
现代汉语中的动补结构是一个丰富的类,本文只考察其中一个个案“V成”。文中主要运用了三个平面理论和认知语言学的某些思想,对“V成”的特征和相关问题进行了共时和历时的描
<正>目的探讨肺栓塞(PTE)患者在恢复初期的肺功能特点。方法对2004年—2012年期间在我院呼吸科确诊的150例肺栓塞患者进行肺功能的测试,将测定的肺通气功能和弥散功能等参数
本文在前人研究成果的基础上,通过所搜集到的语料的统计考察,对汉语中反义副词“至多”、“至少”在语义、句法、语用等方面的对称与不对称现象进行比较全面地考察分析,细致