HSK[高等]作文考试分数调整

来源 :北京语言大学 | 被引量 : 1次 | 上传用户:Mondy_xu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
与客观考试相比,主观考试能更多地提供有关被试的信息。但是,由于主观考试通常是由一个或一个以上的评分员进行主观评分,而主观评分的一致性不高,缺乏信度。有研究表明,在大多数的主观评分中,将近有50%的误差来自评分员之间的不一致性,结果造成评分员间的信度很低。这样就使评分员的评分和被试的真分数之间产生了差距,能力相同的被试也许得到了不同的分数,相同的分数也许并不代表相同的能力。因此,怎样减少主观考试的评分误差,提高评分员信度一直是国内外研究者关注的一个核心问题。国内外运用三大测量理论研究主观评分差异的文章近年来很多。虽然各自介绍的方法也都从不同的侧面和角度对主观评分差异进行过研究,但是,这些方法都不能从根本上解决主观评分重评中存在的主观性问题,因此,对于评分差异,我们可以寻求另外的方法来解决。鉴于此,本文的目的有两个:1)尝试用Longford介绍的调整评分员不一致项(残项)的方法对评分员给出的差异较大的分数进行客观的数学上的调整,希望这种方法能最大限度地减少评分误差,真正反映出被试的能力,从而能真正解决主观评分重评中的主观性问题;2)对残项调整模型和严厉度调整模型进行比较,考察这两种方法在分数调整方面哪种效果更好。从残项调整结果来看,这种方法还是比较令人满意的,而且,通过比较两种模型调整结果,我们可以得出这样的结论:残项调整模型比严厉度调整模型对分数的调整范围更广、调整幅度更大,而且它使评分员的评分差距更小,因而它的调整结果更为理想。但它仍然不能彻底消除严厉度调整模型存在的一些问题,对此,我们可以进行进一步的研究。
其他文献
民间藏有许多古代印玺,其中不乏玉玺,只不过其印面的字义辨析与印玺的年代断定颇有一定难度,不像明清玉玺那么一目了然。或许,古玉收藏鉴赏的乐趣也就蕴藏在此。笔者所接触过的吉
期刊
《太平经》是东汉时期一部重要的道教典籍,语言形象生动、通俗浅显,口语化强,并涌现了大量为该书所独有的特色语词。而东汉上承上古,下启中古,是汉语史研究的重要时期,所以从语言研
受事主语句是受事做主语的句子,在现代汉语中的使用有扩大的趋势。很多学者对受事主语句的类型、表意功能、使用条件及形成的原因等都进行过有意义的探讨。本文以报纸新闻导语
目的:观察益肺汤联合吉非替尼治疗肺癌脑转移头痛患者的临床效果。方法:将98例肺癌转移头痛患者随机分为研究组(n=50)与对照组(n=48),研究组患者采用益肺汤联合吉非替尼结合
语言的僵化现象自上世纪七十年代开始已成为第二语言习得领域研究的热门话题,本文以NangJiang关于词汇僵化的理论为依据,以母语为汉语的具有中高级英语水平的英语学习者的词汇
转喻是一种重要的修辞格。长期以来人们从不同的角度对它进行了研究。修辞学家认为转喻是一种替代关系。然而,认知语言学家认为转喻是人的一种思维方式,这种思维方式根植于人
本文对南宋洪迈《容斋随笔》一书中常用反义词聚进行考察研究,共分四部分: 首先是前言部分。简要介绍了《容斋随笔》的语料价值,本论文的主要研究内容和研究方法,并介绍了本文
文章针对无锡地铁2号线车辆全自动车钩连挂故障现象,通过模拟正线连挂实况,对连挂电气控制信号高低位触点实况进行了测量分析,并就全自动车钩连挂可靠性对生产及车辆运用的重
所谓产业链,就是以市场前景比较好的、科技含量比较高的、产品的关联度比较强的优势企业和优势产品为链核,通过这些链核,以产品技术为联系,资本为纽带,上下连结、向下延伸、前后联
从2001年申办奥运成功,七年多来,北京在人文、生态、生活环境等各方面都发生了巨大的变化。一度令人胆战心惊的“沙尘暴”,取而代之的是绿树和蓝天,环境质量明显改善,让北京普通老