基于句法标注语料库的中学英语学习者作文句法复杂度研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:xiaomayc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
句法复杂度指的是学习者语言产出中不同句法单位的数量以及各句法单位之间的关系(Bulté&Housen 2012)。Ortega(2012:128)认为在二语习得研究中,句法复杂度指标可被用来衡量语言水平、描述语言特征和追踪语言发展。句法复杂度指标的变化能反映出学习者语言能力,尤其是句法能力的变化。据此,相关研究有助于我们了解二语习得的具体过程,对二语习得和二语写作理论的构建具有重要的参考意义。鉴于句法复杂度研究的重要作用和价值,自上世纪末以来,相关研究方兴未艾、硕果累累。大批实证研究旨在探索句法复杂度与学习者语言水平或写作水平的关系,这些研究结果已表明句法复杂度指标可以区分学习者的语言水平或写作水平,并找到了一些能预测学习者语言水平或写作水平最有效的指标。这些研究结果有助于我们了解高分作文或高水平作文的文本特征,因此对写作教学、写作测试和教材编写具有重要的指导作用。经过三十多年的发展,近来,句法复杂度研究中又出现新的研究动向,比如聚焦中低水平的初高中英语学习者语言产出中的句法复杂度特征、使用更加具体的细颗粒句法复杂度指标(fine-grained syntactic complexity measures)、依托于句法标注语料库以及关注句法复杂度发展的动态过程。与此同时,句法复杂度研究领域还存在两大研究局限,即缺少句法多样度(syntactic variety)研究和缺乏本族语者与学习者语言句法复杂度的对比研究。在一系列句法复杂度定义和写作测试评分标准中,句法复杂度被认为涵盖两个维度—句法成熟度(syntactic elaboration)和句法多样度。句法成熟度测量的是语言产出单位的长度,如子句(clauses)、T单位(T-units)和句子(sentences)以及特定句法结构的使用密度,主要包括从属结构(subordination)、并列结构(coordination)和复杂名词性短语(noun phrasal elaboration)等。理论上来说,学习者产出中的语言单位越长,上述特定的句法结构使用密度越高,这些文本的句法特征也就更加成熟;句法多样度测量的是语言产出中句法结构的多样性,即不同句法结构使用的数量。然而,现有句法复杂度指标大多观测的是语言产出中的句法成熟度,忽视了句法多样度。因此,句法多样度是否可以衡量学习者语言水平或写作水平还有待考察。同时,相关实证研究的缺失也降低了句法复杂度定义和写作评分标准的内容效度,因为这些定义和评分标准描述语都假定句法多样度可以反映学习者的语言水平或写作水平。有研究者认为,将学习者语言中的句法复杂度同本族语者相比,可以凸显出学习者语言与本族语者语言的异同,有助于广大教师进一步明确写作教学中的重难点,采取更有针对性的教学指导,从而提高二语习得者的写作水平(Ai&Lu 2013)。然而,目前学界仍缺乏此类研究,尤其是缺少比较初高中生英语学习者和初高中本族语者作文中的句法复杂度研究。上述四大研究态势有助于我们全面了解不同阶段二语习得者作文中的句法复杂度特征以及句法复杂度动态发展过程。但是,总的来说,面向这四大新兴趋势的研究仍数量偏少,少有研究结合了所有的这四大新兴趋势。目前的研究大多只关注某一趋势,这样不利于我们勾画学习者二语作文句法复杂度发展的全貌。两大研究局限更加剧了句法复杂度研究的缺陷。一方面,对句法多样度研究的忽视会导致我们只了解二语作文部分句法复杂度特征,即句法成熟度特征;另一方面,对本族语对照组的忽视,也会造成我们无法捕捉学习者语言中特有的句法复杂度特征,尤其是句法上的不足,从而不能采取更有针对性的教学方案。为了进一步拓展句法复杂度研究发展新趋势和弥补相关研究不足,本研究探索了410篇中国中低水平中学英语学习者记叙文作文中的句法复杂度特征,并比较二语学习者和英语本族语者学生作文中的句法复杂度的异同。由于句法复杂度是一个多维度构念,研究共考察了三个维度的句法复杂度特征,包括粗颗粒句法成熟度(large-grained syntactic elaboration)、细颗粒句法成熟度(fine-grained syntactic elaboration)和句法多样度(syntactic diversity)。本研究的主要目的包括1)明确每个水平组或年级组学生作文中具体的句法复杂度特征;2)找到能区分中低水平中学英语学习者写作水平最有效的句法复杂度指标;3)发现二语学习者作文中句法复杂度与本族语学生作文句法复杂度的异同。为实现这三大研究目标,研究提出了六个研究问题,研究问题1-3旨在探索中低水平中学生英语作文中的句法复杂度,以完成目标一和目标二;研究问题4-6旨在发现英语学习者和英语本族语者作文中的句法复杂度异同,以完成目标三,六个具体的研究问题为:1)每个水平组学生作文中,粗颗粒句法成熟度呈现怎样的特征?哪些粗颗粒句法成熟度指标可以衡量初高中生英语学习者写作水平?2)每个水平组学生作文中,细颗粒句法成熟度呈现怎样的特征?哪些细颗粒句法成熟度指标可以衡量初高中生英语学习者写作水平?3)每个水平组学生作文中,句法多样度呈现怎样的特征?句法多样度指标是否可以衡量初高中生英语学习者写作水平?4)就粗颗粒句法成熟度而言,英语学习者和英语本族语者作文存在什么样的异同?5)就细颗粒句法成熟度而言,英语学习者和英语本族语者作文存在什么样的异同?6)就句法多样度而言,英语学习者和英语本族语者作文存在什么样的同?研究共使用了两个语料库,分别为学习者语料库和本族语对比语料库。学习者语料为410篇中国中低水平中学生英语学习者所写的记叙文。语料于2015年,从浙江省一所初中(三个年级:七年级、八年级、九年级)和一所高中(三个年级:十年级、十一年级、十二年级)收集,要求学生在课堂30分钟内,以“A(n)happy/annoying/embarrassing thing or My last weekend”为题,写一篇记叙文。参与者为来自六个年级的13-18岁中学英语学习者,母语为汉语,英语水平中等以及中等偏下。为了更好地解答研究问题(1)-(3),我们结合学生的年级水平和作文分数,将410篇语料分成三个写作水平组。首先,我们依据学生的年级水平,将学生作文分成三组,每两个年级一组,即组别1(七年级和八年级)、组别2(九年级和十年级)和组别3(十一年级和十二年级)。其次,为了确保每个组别中学生写作水平的同质性,我们剔除了每个组别中作文分数的极值(outlier),共6篇作文被去除。换言之,研究保留了404篇作文进行下一步分析,共计53912个字符,其中组别1有134篇作文,组别2有148篇作文,组别3有122篇作文。方差分析表明高水平组学生作文分数显著高于低水平组,且事后多重比较分析进一步表明每相邻的两个水平组作文分数也存在显著差异。因此,高水平组学生的写作水平显著好于低水平组学生的写作水平。本族语语料为40篇英国中学生课堂作文,该40篇语料按照若干标准从Growth in Grammar语料库中的十一年级组别中随机选取。Growth in Grammar语料库是一个涵盖英国中小学生课堂作文的数据库,共有来自英国不同地区二年级、六年级、九年级和十一年级学生的数千篇作文,作文体裁包括文学性作文(literary essays)、非文学性作文(non-literary essays)和信件(letters)。针对研究问题(4)-(6),为了更加科学高效地比较学习者和本族语者英语作文中的句法复杂度特征,我们分别选取了学习者语料库和本族语语料库中水平最高的组别,即学习者语料库中的组别3(十一年级和十二年级)和本族语语料库中十一年级组。为了尽可能地确保学习者语料和本族语者语料中作文体裁的一致性,我们从Growth in Grammar语料库中的十一年级非文学体裁作文中,随机抽取了40篇作文,共25685个字符。研究选取了来自三个维度的18个句法复杂度指标:7个粗颗粒句法成熟度指标、10个细颗粒句法成熟度指标和1个句法多样度指标。七个粗颗粒句法成熟度指标为平均子句长度(mean length of clause)、平均T单位长度(mean length of T-unit)、平均句子长度(mean length of sentence)、每个子句中从属子句数量(dependent clauses per clause)、每个句子中T单位数量(T-units per sentence)、每个子句中并列短语数量(coordinate phrases per clause)和每个子句中复杂名词性短语数量(complex nominals per clause)。这7个指标的值由二语句法复杂度分析器(L2 Syntactic Complexity Analyzer)自动分析得出。十个细颗粒句法成熟度指标包括三个从属句类型频率的指标:状语从句标准化频率(advcl)、宾语从句标准化频率(ccomp)和定语从句标准化频率(acl:recl);五个名词短语类型频率的指标:形容词性物主代词标准化频率(nmod:poss)、名词作定语标准化频率(nn)、形容词作定语标准化频率(amod)、介词短语作定语标准化频率(prep:attr)和形容词性定语从句标准化频率(acl:recl1);以及三个介词短语类型频率的指标:介词短语作状语标准化频率(prep:adv)、介词短语作宾语标准化频率(prep:obj)和介词短语作定语标准化频率(prep:attr)。研究所使用的句法多样度指标为标准化依存关系类符形符比(corrected type-token ratio of dependency relations)。十个细颗粒句法成熟度指标值和一个句法多样度指标值由自建的依存句法标注的语料库中计算分析得出。研究使用了多元方差分析或Kruskal-Wallis检验探究18个句法复杂度指标在三个水平组之间的差异,以解答研究问题(1)-(3),主要结果和发现如下:1)本研究语言水平最低的学生,即组别1(七年级和八年级组)的学生,已经在作文中使用了大多数目标句法结构,包括从属结构(如宾语从句和状语从句)、并列结构、复杂名词性短语(如形容词作定语、形容词性物主代词和名词作定语)和介词短语(如介词短语作状语和介词短语作宾语)。2)仍有部分目标结构只出现在高水平组,即组别2(九年级和十年级组)和组别3(十一年级和十二年级组)学生作文中,包括定语从句、介词短语作定语和形容词性定语从句等。同时,这三个结构很有可能因为在教科书中出现靠后,输入频次相对较少,因此而习得和使用偏后。3)七个粗颗粒句法成熟度指标中,4个指标在三个水平组间存在显著差异,说明这4个粗颗粒句法成熟度指标是衡量中学生英语写作水平的有效指标,分别为平均T单位长度、平均句子长度、每个子句中从属子句数量和每个子句中复杂名词性短语数量。三个长度指标分别测量了不同层面的句法复杂度:平均子句长度测量的是子句层面复杂度(clausal-level complexity);平均T单位长度测量的是句子层面复杂度(sentential-level complexity);平均句子长度测量的是总体复杂度(holistic complexity)。4)十个细颗粒句法成熟度指标中,六个指标可以有效地区分中学英语学习者的写作水平,分别是状语从句标准化频率、宾语从句标准化频率、定语从句标准化频率、介词短语作定语标准化频率、形容词性定语从句标准化频率和介词短语作宾语标准化频率。5)研究所使用的句法多样度指标:标准化依存关系类符形符比在三个水平组间呈现显著差异,是衡量中学生英语写作水平的有效指标。研究还使用了独立样本t检验或Mann-Whitney U检验来考察18个句法复杂度指标在学习者组和本族语者组之间的差别,以解答研究问题(4)-(6)。具体的研究结果和发现包括:1)十一个句法复杂度指标在学习者组和本族语者组之间呈现显著差异,包括平均子句长度、平均T单位长度、平均句子长度、每个子句中从属子句数量、每个子句中并列短语数量、每个子句中复杂名词性短语数量、宾语从句标准化频率、定语从句标准化频率、名词作定语标准化频率、介词短语作定语标准化频率和形容词性定语从句标准化频率。2)就句法复杂度而言,本族语者作文比学习者作文更复杂,主要体现在使用了更长的句法单位(如子句、T单位和句子)、更多的并列短语、更多的从属结构(如宾语从和定语从句)、更多的复杂名词性短语(如名词作定语和形容词性定语从句)和更多的介词短语(如介词短语作定语)。3)然而,某些目标结构的使用频率在学习者和本族语者作文中无显著差异,包括并列子句、状语从句、形容词性物主代词、形容词作定语和介词短语作状语。上述结果表明中国中学英语学习者已熟练掌握这些结构。学生对这些结构较好掌握的原因可能有一语的正迁移和这些结构在教科书中先出现,进而具有较高的输入频率。综上所述,研究发现了每个水平组学生作文中的具体句法复杂度特征,指出了能衡量中低水平中学生英语学习者写作能力最有效的句法复杂度指标以及明晰了学习者和本族语者作文中句法复杂度的具体差异。相关研究结果和发现对二语复杂度研究具有重要的理论价值以及对写作教学和评估也具有重大的实际意义。经过和前人研究结果的对比,本研究进一步证明了中低水平中学生英语学习者作文中的句法复杂度特征和中高水平大学生英语学习者作文中的句法复杂度特征存在一定的差异。因此,能衡量中高水平学习者写作能力的指标并不总是适用于中低水平学习者,比如从属结构使用密度虽然不能衡量高水平学习者的写作水平,但是却能较好地预测中低水平学习者的写作水平。这也表明学习者语言能力发展是一个动态复杂的过程,因此处于不同阶段的语言习得者,需要不同的句法复杂度指标来评估他们的写作水平。据此,本研究结果也为动态复杂系统理论提供了新的实证数据,拓展了动态复杂系统理论在二语习得和二语写作研究中的运用。其次,研究结果也进一步表明使用传统的粗颗粒句法复杂度指标来统一量化一些宏观结构的使用往往会掩盖一些微观结构的发展特征。比如,英语中,常见的复杂名词短语共有五种,研究使用的粗颗粒指标,即每个子句中复杂名词短语数量结果表明随着语言水平的提升,学生会在作文中使用更多的复杂名词短语。但是,研究使用的细颗粒指标,即五个复杂名词短语类型的标准化频率结果表明并不是五种名词短语类型使用频率都呈上升态势。由于中低水平的中学生和细颗粒句法复杂度指标在以往研究中常常被忽视,因此未来需要更多的研究关注中低水平学生作文中的语言特征以及二语学习者作文中微观的句法复杂度特征。此外,本研究是目前学界为数不多探讨句法多样度和写作水平关系的研究,研究结果表明句法多样度指标可有效地预测中学生英语学习者的写作水平,为众多复杂度定义和写作评分标准将句法多样度视为句法复杂度中的一大重要维度的做法提供了实证依据和支撑。最后,研究使用了依存语法理论框架来标注研究所使用的语料库,使得我们可以更加高效和准确地提取目标句法结构。由于依存语法视单词而非短语为句法的基本单位,所以使用依存语法来分析学习者语言更不易受学习者语言中的句法错误影响,研究也显示了依存语法是更适合二语习得研究的句法框架。就写作教学而言,基于本研究的结果,广大一线教师可在日常教学中,重点关注中学生作文中两类句法结构:可区分学习者写作水平的句法结构以及与本族语者相比,学习者语言中较少使用的句法结构,以提高学生的写作分数和写作水平。例如,定语从句和介词短语作定语既可预测英语学习者的写作水平也可区分本族语和学习者的英语作文,因此,中学英语教师应通过各种教学方法,提高这两类结构的习得效果。最后,由于研究发现句法多样度是影响学生写作分数或写作水平的重要因素之一,所以句法多样度应该被囊括在写作评分标准中,包括写作自动评分系统的评分标准。诚然,本研究也存在一定的局限,具体体现在研究结果的普适性上。研究只考察了母语为汉语和中学生记叙文中的句法复杂度特征,因此研究结果是否适用于所有母语背景下学习者所有体裁的英语写作有待进一步考证。
其他文献
本文通过社会调查法对高校攀岩教练员和运动员进行深入调查研究。得出以下结论,高校攀岩运动员的文化素养有待于提高;部分高校因扶持资金不足,限制了高校攀岩训练器材设施;高校攀
摘 要:随着我国高等教育大众化时代的到来,大学生就业难问题越发凸显,如何更好地“以创业带动就业”已成为高校亟需解决的问题。本文针对目前大学生创业精神培养缺失的窘境,就大学生创业精神培养途径提出了具体建议。  关键词:大学生;创业精神;培养途径  创业教育首先是一种思想意识教育,只有通过创业教育唤醒大学生的创业意识,培养大学生的创业精神,才能激发大学生的创业激情。正如联合国教科文组织在《21世纪的高
道家思想博大精深,对中国的传统生活和中国古代科学都产生了很大的影响,本文旨在从《道德经》出发,通过对道家思想的研究,探究道家思想和中国古代科学的关系以及对中国古代科
研究了几种分散剂(AP、MN、G)对ZnO系粉体分散的影响。结果表明,在各自最佳分散条件下,分散剂MN对ZnO系粉体的稳定分散具有用量少,适用pH范围宽,悬浮体粘度低,粉体无团聚等特
微纳米是一个重要的几何尺度,在自然界和人类社会中广泛存在各种实例,如细胞、胶束、金属纳米粒子和脂质体等都处于微纳米级范畴。微纳米尺度材料具有表面效应、小尺寸效应以
译自英语,指穿着打扮时髦,作风大胆、劲爆的年轻女性,认为她们反传统,富于挑战性与刺激性。如《人民日报》2003年7月18日:“事实上,人们看多了甜腻美眉、野蛮女友、劲爆辣妹的形象
<正>对未知的事物充满强烈的好奇心和探究欲是小学生的天性,而足球比赛其场面之恢弘、参赛运动员之多、对抗之激烈、比赛时间之长、观众之热烈,对小学生而言是一种强烈而持久
质量是辞书的生命杨志本编者按:下面发表的一组文章表明,《海军大辞典》的编者严肃认真,兢兢业业,一丝不苟,从而使此书达到较高的质量水平;出书以后,该书编者又主动进行调查研究,虚心
原发性高血压是一种常见的心血管疾病,病程长,可对心、脑、肾等器官造成严重伤害,血压如果持续升高可能引发脑出血。高血压还易诱发其它严重疾病,如中风、心衰、心肌梗塞、冠
【正】 一当今的社会已经进入信息时代。世界范围内的信息沟通无论在时间上和空间上都达到了空前的规模,也给人们带来了巨大的利益。人类生活在信息的海洋中,每时每刻都在自