论文部分内容阅读
巴赫曼(1990)提出,内容效度体现在测试内容与测试目的的一致性,也体现在测试内容的代表性。目前,国内对于测试内容效度的研究并未提出完善的理论框架,对测试对象的选择也集中在英语、日语、德语和俄语的测试上,很少有研究涉及中文测试。作为国际性的中文测试,汉语水平测试旨在对汉语为非母语的汉语学习者在学习,工作和生活中的汉语的实际运用能力进行准确的测量。针对于不同学习程度的汉语学习者,国家汉办将测试分为由易到难六个等级,其中汉语水平考试五级作为海外留学生申请奖学金的门槛,受到了越来越多留学生的关注。但是,对于汉语水平测试的研究,国内外倾向于探求其发展前景和考试形式的变革,而很少关注测试的内容效度以及测试中学生的表现和评价。鉴于此,本研究采用定量研究和定性研究相结合的方式,探讨了HSK-5深度阅读的内容效度,即测试内容与测试目的一致性问题、测试内容的代表性问题,以及这一测试对留学生汉语学习的反拨作用,并找出促进留学生汉语学习的途径。首先,本研究根据汉语水平考试大纲的特点改写的巴赫曼语言任务特征框架,从输入特征和预期反应两个角度就测试内容与汉语水平测试五级大纲提出的测试目的进行比较,研究测试内容与目的的一致性;其次,本研究对50名兰州交通大学海外留学生进行HSK-5的测试,使用Ministep软件创建Rasch项目难度与学生成绩分布图,分析学生能力与测试难度的拟合程度,研究测试内容的代表性;第三,本研究对50名留学生发放调查问卷,收集并整理了汉语水平考试五级对于学生学习态度、目的、材料、内容、方法方面的影响,研究HSK汉语水平测试对学习过程的反拨作用。本研究结果呈现如下:(1)就测试内容和目的的一致性而言,依据巴赫曼(1999)提出的语言任务特征框架,在输入特征方面,文章平均长度为390字,在大纲规定的250字-570字之间;文章句型为施为句2.4%,简单句11.8%,复杂句71.8%,符合大纲对句型多样性的要求;文章中体裁为叙述文44%,说明文52%,议论文4%,未出现应用文体裁,但基本符合大纲规定;文章话题为生活36%,文学4%,自然12%,经济16%,工作4%,未出现文化相关话题,但基本符合大纲规定;实际阅读平均速度为98词/分钟,低于大纲规定的128词/分钟。在预期反应方面,文章所考察的阅读技巧(其中:概括大意为24%,细节理解为74%为,背景理解为2%),与大纲规定一致;预期反应类型全部为选择性产出即多项选择题,并不符合大纲对于考查形式多样化的规定,但整体而言,测试内容与测试目的切合度较好,具有较强的一致性。(2)就测试内容的代表性而言,依据Beglar的内容代表性理论(2010)的三方面,首先,Rasch模型反应出的考生能力柱状图和试题题目簇左右对应,说明测试项目具有较好的代表性,不存在天花板效应和地板效应,但存在3道题目(Q71、Q73、Q82)过于简单,3道题目(Q77、Q72、Q75)难度太大和4道题目(Q88、Q90、Q75、Q73)不适合考生的情况,这些项目都为无效测试项目。第二,根据Beglar(2010)的难度跨度公式,测试项目的分离系数是3.06,测试项目距的难度跨度达到4.41,说明阅读理解的难度能够界定的学生的实际水平等级比较大,能较为有效地区分考生的水平(Beglar,2010)。第三,从难度等级间隙来看,除无效题目外,多数题目难度间隙呈现均匀分布,现有的题量和试题难度代表性较强,能够有效地诊断考生的汉语阅读理解水平,但个别过难或过易的项目影响了测试的内容效度。(3)反拨作用的调查问卷结果显示HSK-5在6个方面对汉语学习者的学习具有反拨作用。在学习态度方面,87.5%的受试认为测试激发了其学习动机和兴趣;在学习目标方面,72.92%的受试意识到备考测试是为了将来的学习和工作;在学习方法方面,75%的受试表示测试促使他们有计划的进行阅读能力的训练;在学习内容方面,72.83%的受试认为测试促使他们学习汉语阅读技巧和策略;时间分配方面,56.25%的受试会考试之前延长备考时间;学习材料方面,80%的受试表示愿意为测试主动购买阅读材料。因此,在今后的HSK汉语水平试题设计中,测试的设计者应该丰富阅读题目的考察形式,测试内容中的议论文和应用文数量应适当增加;其次,虽然测试内容的代表性较强,但是试题设计者还需结合学生的实际水平不断打磨,减少偏易或偏难的题目;另外,教师应该充分利用测试的反拨作用,帮助汉语学习者调整学习方法和内容,而学习者也要积极主动接触生活中活的语言,从多方面积累汉语文化知识,提高语言交际能力。