论文部分内容阅读
【摘要】语言学家认为,文本可读性(readability)决定了文本阅读的难易程度。中学英语课本作为学生外语学习的依托,其文本可读性深刻影响学生的外语学习过程,词汇难度则是影响文本可读性的核心要素。本文以苏教牛津译林版的初三英语教材和同一出版社出版的高一英语教材为研究对象,通过语料库技术对其词汇难度做参数分析,以期对江苏地区初高中外语衔接教学提供一些思路。
【关键词】文本可读性;英语教材;衔接语料库
【作者简介】章翎,江苏省苏州市吴中区碧波中学。
牛津译林版外语教材自开始在江苏地区推行使用,内容和编排进行了多次修订。每册课本单元总数、单元话题均有过微调。初中义务教育阶段的英语教材“Fun with English”系列和高中学段“Advance with English”系列,虽均出自同一出版社,但是否在两个学段的课文的词汇难度上体现过渡性,研究却不多见。
语料库技术通过计算机,可将文本中的词句规律以数据形式呈现出来,从大量文本中发现语言规律,使研究成为一种语言探索过程(Johns,1993),而语料库检索工具大大简化了研究中的统计过程。本文借助Range 32 对苏教牛津译林出版社出版的“Fun with English”九年级上下两册课本和“Advance with English”高中模块一、模块二两册课本做数据统计。研究从词汇难度这个语言学指标入手,提供客观数据,进行纵向比对,并结合江苏地区实际教学情况对数据结果进行阐释。
关于研究工具Range 32
Range 32 软件由Paul Nation 教授及其团队研发,可在惠林顿维多利亚大学的语言学及应用语言研究学院官网页面获取。主要有Range_BNC和Range_GSL_AWL两个版本,其中前者主要用于口语化材料的分析(Liang,2010),而后者用于书面化语言材料。因而,本研究以后者为研究工具。Range_GSL_AWL内附有BASEWORD1.txt 到BASEWORD3.txt 三个基础词汇库。前两个词汇库涵盖2000词族(word families),均收录自1953年Michael West编纂的A General Service List of English Words,而最后一个词汇库则是Coxhead在2000编纂的Academic Word List, 共收录570 词族。Range软件中使用的词族、类符(type)、形符(token)、形符类符比(type-token ratio)等术语的数据意义将在后续比对分析时做解释。
语料库技术在词汇难度统计上的应用
前文中已解释过Range32 的两个版本Range_BNC和Range_GSL_AWL的使用场合,所以本研究使用Range_GSL_AWL去统计自建语料库的相关文本。
在实际教学中,词语的常见度,或者说使用频率,一般也认为是影响文本可读性的一个不可忽视的因素。往往一些较短的词语由于使用频率较低、日常并不常见而成为读者的阅读障碍。因此本文在复杂词语的分布情况时将词汇频率考虑进去。
词汇难度主要参照Range 生成的数据表中WORDLIST THREE和NOT IN THE LIST 两个项目中类符(type)的百分比,这两个项目类符的百分比体现生僻词汇的出现频率。需在这里做出解释的是,由于WORDLIST ONE 是与BASEWORD1词汇库比对的结果,而BASEWORD1 词库中包含的是1000个最常使用的词族,所以可认为是最基本的词族集合。BASEWORD 2 则是次常用的2000個词族。剩下的BASEWORD3中的570个词族主要应用在学术领域。以此类推,不在三个词库中的词汇可认为是英文中的冷门词汇。在这里还需对类符(type)和形符(token)做一些解释。每次一个单词出现一次,形符数加一(Schmitt,2008)。当单词再复现一次,形符需再次计数,而类符数却不再增加。
同样,以9A 课本第一单元的课文Reading部分为例,图1为使用Range32 处理后生成的数据图例,得到各种参数。
从图1中可以看出,Range32 可以提供文本语料所用词汇在三个标准词库中的类符占比。观察该图,可知9A 课本第一单元课文中的词汇的难度分布情况。在WORDLIST THREE中本语篇类符占比为3.83%,而在NOT IN THE LIST中的类符占比为9.29%。然后,通过Range32对自建语料库中的其他语料做同样处理,做好数据和重要参数的记录。为了全面、综合地进行对比,得到以下数据(如表1),方便横向、纵向地进行数据对比。
表1所列的结果为本研究提供了一些参考信息。总的来看,无论从WORDLIST THREE还是NOT IN THE LIST中的类符占比来看,教材9A和9B中难词的出现率都不低。相比之下,针对高一学生的模块一教材可读性更强,至少在词汇难度方面是这样。通过观察数据,可发现在高一的两本教材中,难词更容易出现在每个单元的第二篇课文中,即Project 部分里。
高中两册课本从词频角度看,词汇难度却要低于初三的两册课本。参考最后一张综合表格里最后一行均值,9B词汇难度最大。高一的模块一课本的词汇难度却是四册课本里最低的,可以反映这样一个基本事实:模块一课本更多使用生活化的(学术词汇和生僻词词频低)多音节词(体现在词汇长度上),用词多为高频词;而9B课本则包含大量简短的低频词(NOT IN THE LIST 中类符占比高达12.58%,直接拉高了均值)。
这一发现其实相对符合预期。高中模块一课本为学生刚升入高中接触的第一本英语教材,话题也多为学校生活、亲子问题等日常常见主题,更加贴近真实场景。9B 课本为九年级最后一册课本,不少学校在实际授课时,只选讲该教材的部分内容。九年级的大部分内容已在上册涵盖,下册教材更多是为学生扩充词汇量,为升入高中做好准备。9B课文选材上涉及了文化、科技、历史人物等较学生日常生活较远的话题,而这些话题即便出现在平时的阅读中,也是学生苦恼的语篇题材。课文选材的限制直接影响了选词。但尽管9B课本的词汇难度已经很高,高中英语模块二每个单元project中的词汇难度均值更高,达7.91%,同样也是与课文选材相关。模块二在每单元第二篇课文的选材上涉及自然未知之谜、香格里拉、杨利伟传记等,这些都是较难的题材,选材的难度大大影响了文本的可读性。 结合研究结果谈谈对教学的一些启示和建议
在高一阶段,教师应从培养学生的阅读能力入手,使学生的阅读能力不断向更高层次发展。在中学英语教学中,阅读教学至关重要。因此,高中英语教师倾向于要求学生进行大量的课外阅读训练,而在高一学年刚开始时,这种做法事实上是不明智的。过多难度大的阅读训练会导致学生在英语学习中产生消极情绪,产生挫折感。这不利于他们的阅读水平的提高。Range 32生成的文本可读性各参数数据证明:高中课本模块1在难词分布和难词密度方面低于九年级教材9A、9B和模块2。因此,大量的阅读强化训练并不总是明智的,教师需更多关注阅读技能的教授,而非一味进行词汇知识的传授。
教师也可在日常的教学中,学会将语料库技术应用进日常教学中,充分发挥现代技术对教学的促进作用。WordSmith和Range 等语料库检索工具还可以应用在“语境共现”“搭配归纳”等教科研领域对英语课内、外的语篇做详尽分析。平时的教学活动里,教师在对学生做“形成性评价”时,也可以利用语料库技术对平时搜集到的学生常见语用错误作统计和分析,在自己编排初高中过渡教学材料时作为有针对性的参考。所以在这里笔者建议高中英语们在新课授课前,使用自己或学校集体备课编写的过渡性教学材料,以特定话题为导向进行过渡教学,使学生更快适应高中英语的教学。同时,老师们也需要精心设计教学活动,带领学生过好词汇关,及时温习初中所学单词并关注进入高中后的“熟词僻义”现象。
本研究还有一些不完善的地方,后续仍需做进一步的改进。希望本研究的一些发现能对江苏地区使用这套教材的老师带来一些启发,老师们能结合一线教学进行进一步的探索。同时也期望更多针对苏教版英语教材的研究出现,完善教材的编写,真正实现学生能力的综合发展。
参考文献:
[1]Cobb T, Boulton A. Classroom applications of corpus analysis. In: Biber D, Reppen, R.(Eds.) The Cambridge Handbook of English Corpus Linguistics[M]. Cambridge: Cambridge University Press, 2015.
[2]何安平.语料库语言学与英语教学[M].北京:外语教学与研究出版社,2004.
[3]Heatley A, Nation P, Coxhead, A. Range[OL]. Retrieved from https://www. victoria.ac.nz/lals/about/staff/paul-nation#vocab-programs, 2002.
[4]Klare G R. The Measurement of Readability[M]. Ames: Iowa State University Press, 1963.
[5]章翎.蘇教版初高中英语教材衔接的多模态研究[D].南通大学,2018.
【关键词】文本可读性;英语教材;衔接语料库
【作者简介】章翎,江苏省苏州市吴中区碧波中学。
牛津译林版外语教材自开始在江苏地区推行使用,内容和编排进行了多次修订。每册课本单元总数、单元话题均有过微调。初中义务教育阶段的英语教材“Fun with English”系列和高中学段“Advance with English”系列,虽均出自同一出版社,但是否在两个学段的课文的词汇难度上体现过渡性,研究却不多见。
语料库技术通过计算机,可将文本中的词句规律以数据形式呈现出来,从大量文本中发现语言规律,使研究成为一种语言探索过程(Johns,1993),而语料库检索工具大大简化了研究中的统计过程。本文借助Range 32 对苏教牛津译林出版社出版的“Fun with English”九年级上下两册课本和“Advance with English”高中模块一、模块二两册课本做数据统计。研究从词汇难度这个语言学指标入手,提供客观数据,进行纵向比对,并结合江苏地区实际教学情况对数据结果进行阐释。
关于研究工具Range 32
Range 32 软件由Paul Nation 教授及其团队研发,可在惠林顿维多利亚大学的语言学及应用语言研究学院官网页面获取。主要有Range_BNC和Range_GSL_AWL两个版本,其中前者主要用于口语化材料的分析(Liang,2010),而后者用于书面化语言材料。因而,本研究以后者为研究工具。Range_GSL_AWL内附有BASEWORD1.txt 到BASEWORD3.txt 三个基础词汇库。前两个词汇库涵盖2000词族(word families),均收录自1953年Michael West编纂的A General Service List of English Words,而最后一个词汇库则是Coxhead在2000编纂的Academic Word List, 共收录570 词族。Range软件中使用的词族、类符(type)、形符(token)、形符类符比(type-token ratio)等术语的数据意义将在后续比对分析时做解释。
语料库技术在词汇难度统计上的应用
前文中已解释过Range32 的两个版本Range_BNC和Range_GSL_AWL的使用场合,所以本研究使用Range_GSL_AWL去统计自建语料库的相关文本。
在实际教学中,词语的常见度,或者说使用频率,一般也认为是影响文本可读性的一个不可忽视的因素。往往一些较短的词语由于使用频率较低、日常并不常见而成为读者的阅读障碍。因此本文在复杂词语的分布情况时将词汇频率考虑进去。
词汇难度主要参照Range 生成的数据表中WORDLIST THREE和NOT IN THE LIST 两个项目中类符(type)的百分比,这两个项目类符的百分比体现生僻词汇的出现频率。需在这里做出解释的是,由于WORDLIST ONE 是与BASEWORD1词汇库比对的结果,而BASEWORD1 词库中包含的是1000个最常使用的词族,所以可认为是最基本的词族集合。BASEWORD 2 则是次常用的2000個词族。剩下的BASEWORD3中的570个词族主要应用在学术领域。以此类推,不在三个词库中的词汇可认为是英文中的冷门词汇。在这里还需对类符(type)和形符(token)做一些解释。每次一个单词出现一次,形符数加一(Schmitt,2008)。当单词再复现一次,形符需再次计数,而类符数却不再增加。
同样,以9A 课本第一单元的课文Reading部分为例,图1为使用Range32 处理后生成的数据图例,得到各种参数。
从图1中可以看出,Range32 可以提供文本语料所用词汇在三个标准词库中的类符占比。观察该图,可知9A 课本第一单元课文中的词汇的难度分布情况。在WORDLIST THREE中本语篇类符占比为3.83%,而在NOT IN THE LIST中的类符占比为9.29%。然后,通过Range32对自建语料库中的其他语料做同样处理,做好数据和重要参数的记录。为了全面、综合地进行对比,得到以下数据(如表1),方便横向、纵向地进行数据对比。
表1所列的结果为本研究提供了一些参考信息。总的来看,无论从WORDLIST THREE还是NOT IN THE LIST中的类符占比来看,教材9A和9B中难词的出现率都不低。相比之下,针对高一学生的模块一教材可读性更强,至少在词汇难度方面是这样。通过观察数据,可发现在高一的两本教材中,难词更容易出现在每个单元的第二篇课文中,即Project 部分里。
高中两册课本从词频角度看,词汇难度却要低于初三的两册课本。参考最后一张综合表格里最后一行均值,9B词汇难度最大。高一的模块一课本的词汇难度却是四册课本里最低的,可以反映这样一个基本事实:模块一课本更多使用生活化的(学术词汇和生僻词词频低)多音节词(体现在词汇长度上),用词多为高频词;而9B课本则包含大量简短的低频词(NOT IN THE LIST 中类符占比高达12.58%,直接拉高了均值)。
这一发现其实相对符合预期。高中模块一课本为学生刚升入高中接触的第一本英语教材,话题也多为学校生活、亲子问题等日常常见主题,更加贴近真实场景。9B 课本为九年级最后一册课本,不少学校在实际授课时,只选讲该教材的部分内容。九年级的大部分内容已在上册涵盖,下册教材更多是为学生扩充词汇量,为升入高中做好准备。9B课文选材上涉及了文化、科技、历史人物等较学生日常生活较远的话题,而这些话题即便出现在平时的阅读中,也是学生苦恼的语篇题材。课文选材的限制直接影响了选词。但尽管9B课本的词汇难度已经很高,高中英语模块二每个单元project中的词汇难度均值更高,达7.91%,同样也是与课文选材相关。模块二在每单元第二篇课文的选材上涉及自然未知之谜、香格里拉、杨利伟传记等,这些都是较难的题材,选材的难度大大影响了文本的可读性。 结合研究结果谈谈对教学的一些启示和建议
在高一阶段,教师应从培养学生的阅读能力入手,使学生的阅读能力不断向更高层次发展。在中学英语教学中,阅读教学至关重要。因此,高中英语教师倾向于要求学生进行大量的课外阅读训练,而在高一学年刚开始时,这种做法事实上是不明智的。过多难度大的阅读训练会导致学生在英语学习中产生消极情绪,产生挫折感。这不利于他们的阅读水平的提高。Range 32生成的文本可读性各参数数据证明:高中课本模块1在难词分布和难词密度方面低于九年级教材9A、9B和模块2。因此,大量的阅读强化训练并不总是明智的,教师需更多关注阅读技能的教授,而非一味进行词汇知识的传授。
教师也可在日常的教学中,学会将语料库技术应用进日常教学中,充分发挥现代技术对教学的促进作用。WordSmith和Range 等语料库检索工具还可以应用在“语境共现”“搭配归纳”等教科研领域对英语课内、外的语篇做详尽分析。平时的教学活动里,教师在对学生做“形成性评价”时,也可以利用语料库技术对平时搜集到的学生常见语用错误作统计和分析,在自己编排初高中过渡教学材料时作为有针对性的参考。所以在这里笔者建议高中英语们在新课授课前,使用自己或学校集体备课编写的过渡性教学材料,以特定话题为导向进行过渡教学,使学生更快适应高中英语的教学。同时,老师们也需要精心设计教学活动,带领学生过好词汇关,及时温习初中所学单词并关注进入高中后的“熟词僻义”现象。
本研究还有一些不完善的地方,后续仍需做进一步的改进。希望本研究的一些发现能对江苏地区使用这套教材的老师带来一些启发,老师们能结合一线教学进行进一步的探索。同时也期望更多针对苏教版英语教材的研究出现,完善教材的编写,真正实现学生能力的综合发展。
参考文献:
[1]Cobb T, Boulton A. Classroom applications of corpus analysis. In: Biber D, Reppen, R.(Eds.) The Cambridge Handbook of English Corpus Linguistics[M]. Cambridge: Cambridge University Press, 2015.
[2]何安平.语料库语言学与英语教学[M].北京:外语教学与研究出版社,2004.
[3]Heatley A, Nation P, Coxhead, A. Range[OL]. Retrieved from https://www. victoria.ac.nz/lals/about/staff/paul-nation#vocab-programs, 2002.
[4]Klare G R. The Measurement of Readability[M]. Ames: Iowa State University Press, 1963.
[5]章翎.蘇教版初高中英语教材衔接的多模态研究[D].南通大学,2018.