论文部分内容阅读
摘要:语块提取是语块理论研究和应用研究的重要环节。然而,目前学界还缺乏语块提取的统一标准。语块提取的基本方法各有利弊。本文通过自建大学英语口语测试语料库,提出了结合人工识别和语料库自动识别提取语块的方法,为保证语块研究信度和效度提供了方法指导。
关键词:大学英语、口语语料、语块、语块识别
1.引言
语块在二语习得和使用过程中的重要性得到广泛认可。(Ellis 1994,Strengers 2011,胡元江,2015)但是,一直以来对于语块并没有一个确切统一界定,这导致对语块的划分不是一件容易的事情。Pawley 和Syder(1983)曾这样描述划分的困难“(我们)再次重申这种程度不同(gradation)的特点是语言的本质,尝试明确切分会使得我们陷入对母语者知识本质错误解读的危险境地。”(转引自Nattinger 和DeCarrico,1992:38)将近40年过去了,语块识别问题依然困扰着语块研究。更为严重的是,这种状况不利于语块的理论研究和习得研究,也不利于人们对不同研究进行比较从中得出普遍性的结论。(马广惠,2011)
2.研究背景
语块识别一般基于兩个维度,一是短语学维度,二是语料库维度。(胡元江,2015)。主张短语学维度的研究者包括Nattinger 和DeCarrico(1992)、Boers ,et al (2006)、Wood(2009)等。主张语料库维度的研究者有Stubbs & Barth(2003)、肖更生等(2016)。两种方法各有不足,短语学方面往往凭借本族语者的直觉。比如,Nattinger 和DeCarrico(1992)等认为it is X和there is/are/was/were X为语块是有条件的,当表明主张(assertion)时,而且是一种礼貌的表达立场的方式时,其语用功能等同于personally, I think X, in my opinion,或者更为间接的表达方式如as far as I can tell, frankly, to be perfectly honest时则是,这无疑增加了语块识别的主观性;语料库分析方法往往凭借的标准是提取频点,但是往往提取到非语块的词组片段,比如part of the 、end of the 等。有鉴于这两种方法各自的不足,本研究试图结合这两种方法使它们互相取长补短,从而提高语块提取的客观性。
2.1语料收集
本研究语料来自湖北省某一本院校大一学生下学期口语考试。讲话内容全程录音,共得到受试的153份口语音频。随机抽取12份,再将音频转写成文本作为分析语料,共计1596词。
2.2研究步骤
(1) 利用语料库检索软件WordSmith8.0提取口语样本中的2词语块、3词语块和4词语块后与PHRASE List中的短语对比。该短语列表共包含505个最常见(频率最高)、最有用(二语教学)短语,是诺丁汉大学的Schmitt及其博士生Marninez(2012)共同开发的。通过Excel对比功能自动提取语块;
(2) 依据Nattinger 和DeCarrico(1992)语块标准并利用《朗文当代高级英语词典》在线词典(http://www.Idoceonline.com)为依据人工识别语块。
3.结果与讨论
3.1结果
3.2 讨论
在语料库分析方面,通过WordSmith8.0软件对整理过的口语样本语料进行2词语块、3词语块和4词语块的提取,共获得2-4词语块1988个,其中2词语块627个、3词语块699个、4词语块660个,排名前10的2词语块、3词语块和4语块见表1。然后,将其与PHRASE List中短语比较,得到19类,共计37个语块,见表2。值得注意的是其中有些语块并不准确。如not only ,原因在于not only 在本研究语料只是出现在语块not only...but also 之中,未见not only 被单独使用的情形;再比如for good ,其是因为语料库检索软件的的线性处理工作原理,从而提取了研究语料中未出现的语块;至于a good,则是由于机器处理的的重频率(形式)轻意义所造成的。类似于这样的语块或非语块都没有真正的反映出二语学习者头脑中的语块知识,因而对语块语块理论研究和应用研究没有裨益。
在人工提取方面,共计识别79类,159个语块。语块数量多且有意义。人工识别语块有以下几个方面的优势。一是有利于弥补自动提取往往强调连续的语块的弊端,从而将不连续的语块也包括在内。语块应该是连续的,具有完整的意义或明确的功能。(马广惠,2011)比如 not only...but also...、there is no reason to x、remind x of x、make somebody x等。二是自动提取往往忽略搭配,这是因为搭配往往和语言产出的主题高度相关,而自动提取的高频率往往不受制于语境。比如 make money , college students, play basketball,efficient method, last summer, summer holiday 等。当然,人工识别还可以发现学习者的语块使用错误。以put up with our opinion为例,戚炎等(2015)将其归为“语外错误”。根据语境,该学习者想表达的语块并不是put up with ,而应该是put forward。再以in weekend为例,戚炎等(2015)将其归为“语内错误”。in weekend 用法并不存在,其正确用法是at the weekend (英国英语)或 on the weekend(美国英语)。此外,这些语块错误大多是形态错误,这大概率是因为学习者的母语-汉语没有形态变化。汉语和英语是类型学上的不同语言。这点同Wikorsson(2003)的发现一致,即语块受母语影响较强。(转引自王立非,2006)本研究中,中国二语学习者语块错误中的“语内错误”明显多于“语外错误”。关于语块错误的进一步探讨将另文展开。 当然,语块自动提取也有其优点,由于语料分析是基于语言大数据,所以所提取的语块往往更有代表性,当然前提是它必须满足语块成块条件。人工识别虽然能更全面且语块往往是有意义的,但是其识别过程耗时较长,更是往往因人而异、主观性强而受人诟病。此外,心理语言学认为语块既不是语法学家固定的,也不是根据频率决定的,而要看个体使用者的是否将其视为语块。(王立非等,2006)这就需要研究者因时制宜、因地(自然习得/课堂学习)将学习者视为语块加以使用,满足口语交际需要的语块,也就是所谓“纯需求分析”(Wray,2002 转引自 王立非等,2006),也包括在内。本研究中人工识别如此语块9个,包括一些学习者借用的句子(口语测试中提供用于展开思路的问句)、歌名“You Raise Me Up”、以及for the first question、try his best。
4.總结
类似二语习得领域的其它研究热点,语块应用研究的蓬勃发展(尤其是教学目的和使用特征)势必带来人们对语块定义/知识的进一步探索。语块知识的深入研究离不开语言学、心理语言学和神经语言学的协同工作。通过结合计算机和语料库技术对语块的自动提取和人工识别,本研究对大学生非英语专业理工类学生口语语料中语块使用进行定量分析。本研究倡导在语块识别中将采取多方印证的方法将主观性控制到最低,从而最大程度保证语块研究信度和效度,希望能有抛砖引玉作用。
参考文献
[1]Boers F,et al. Formulaic sequences and perceived oral proficiency:Putting a Lexical Approach to the test[J].languageTeaching Research,2006,(10):245-261.
[2]Ellis, R.The Study of Second Language Acquisition [M]. 上海: 上海外语教育出版社,1999.
[3]Nattinger J, DeCarrico J. Lexical Phrases and Language Teaching [M]. 上海: 上海外语教育出版社,2000.
[4]Stubbs,M.& Barth,I.Using Recurrent Phrases as Text_type Discriminators:A quantitative Method and Some Findings[J].Functions of Language 10/1,2003:61-104
[5]Wood D.Effects of fucused instruction of formulaic sequences on fluent expression in second language narratives: A case study [J].CanadianJournalof AppliedLinguistics,2009,(12):39-57.anguage 10/1,2003:61-104
[7]马广惠.英语专业学生二语限时写作中的词块研究[J].外语教学与研究.2009(1):54-60.
[8]马广惠.词块的界定、分类与识别[J].解放军外国语学院.2011(34):1- 4.
[9]胡元江.口语产出中的语块研究:回顾与展望[J].外语教学理论与实践.2011(2):57-63.
[10]戚炎、许翠芹.语块教学对大学生二语言口语流利性研究[J].外语界2015(6):26-34.
[11]肖更生、张再红.英文科技论文标题多维度特征研究—以SCI百篇高被引论文为例[J].中国科技期刊论文.2016(10):1055-1060.
[12]原萍与郭粉绒.语块与二语口语流利性的相关性研究[J].外语界.2010(1):54-62.
[13]王立非、张大风.国外二语预制语块习得研究的方法进展与启示[J].外语与外语教学.2006(5):17-21.
作者简介:黎杨(1979.08-),男,汉族,湖北武汉,研究生(硕士),武汉纺织大学,讲师,研究方向:大学英语教育
关键词:大学英语、口语语料、语块、语块识别
1.引言
语块在二语习得和使用过程中的重要性得到广泛认可。(Ellis 1994,Strengers 2011,胡元江,2015)但是,一直以来对于语块并没有一个确切统一界定,这导致对语块的划分不是一件容易的事情。Pawley 和Syder(1983)曾这样描述划分的困难“(我们)再次重申这种程度不同(gradation)的特点是语言的本质,尝试明确切分会使得我们陷入对母语者知识本质错误解读的危险境地。”(转引自Nattinger 和DeCarrico,1992:38)将近40年过去了,语块识别问题依然困扰着语块研究。更为严重的是,这种状况不利于语块的理论研究和习得研究,也不利于人们对不同研究进行比较从中得出普遍性的结论。(马广惠,2011)
2.研究背景
语块识别一般基于兩个维度,一是短语学维度,二是语料库维度。(胡元江,2015)。主张短语学维度的研究者包括Nattinger 和DeCarrico(1992)、Boers ,et al (2006)、Wood(2009)等。主张语料库维度的研究者有Stubbs & Barth(2003)、肖更生等(2016)。两种方法各有不足,短语学方面往往凭借本族语者的直觉。比如,Nattinger 和DeCarrico(1992)等认为it is X和there is/are/was/were X为语块是有条件的,当表明主张(assertion)时,而且是一种礼貌的表达立场的方式时,其语用功能等同于personally, I think X, in my opinion,或者更为间接的表达方式如as far as I can tell, frankly, to be perfectly honest时则是,这无疑增加了语块识别的主观性;语料库分析方法往往凭借的标准是提取频点,但是往往提取到非语块的词组片段,比如part of the 、end of the 等。有鉴于这两种方法各自的不足,本研究试图结合这两种方法使它们互相取长补短,从而提高语块提取的客观性。
2.1语料收集
本研究语料来自湖北省某一本院校大一学生下学期口语考试。讲话内容全程录音,共得到受试的153份口语音频。随机抽取12份,再将音频转写成文本作为分析语料,共计1596词。
2.2研究步骤
(1) 利用语料库检索软件WordSmith8.0提取口语样本中的2词语块、3词语块和4词语块后与PHRASE List中的短语对比。该短语列表共包含505个最常见(频率最高)、最有用(二语教学)短语,是诺丁汉大学的Schmitt及其博士生Marninez(2012)共同开发的。通过Excel对比功能自动提取语块;
(2) 依据Nattinger 和DeCarrico(1992)语块标准并利用《朗文当代高级英语词典》在线词典(http://www.Idoceonline.com)为依据人工识别语块。
3.结果与讨论
3.1结果
3.2 讨论
在语料库分析方面,通过WordSmith8.0软件对整理过的口语样本语料进行2词语块、3词语块和4词语块的提取,共获得2-4词语块1988个,其中2词语块627个、3词语块699个、4词语块660个,排名前10的2词语块、3词语块和4语块见表1。然后,将其与PHRASE List中短语比较,得到19类,共计37个语块,见表2。值得注意的是其中有些语块并不准确。如not only ,原因在于not only 在本研究语料只是出现在语块not only...but also 之中,未见not only 被单独使用的情形;再比如for good ,其是因为语料库检索软件的的线性处理工作原理,从而提取了研究语料中未出现的语块;至于a good,则是由于机器处理的的重频率(形式)轻意义所造成的。类似于这样的语块或非语块都没有真正的反映出二语学习者头脑中的语块知识,因而对语块语块理论研究和应用研究没有裨益。
在人工提取方面,共计识别79类,159个语块。语块数量多且有意义。人工识别语块有以下几个方面的优势。一是有利于弥补自动提取往往强调连续的语块的弊端,从而将不连续的语块也包括在内。语块应该是连续的,具有完整的意义或明确的功能。(马广惠,2011)比如 not only...but also...、there is no reason to x、remind x of x、make somebody x等。二是自动提取往往忽略搭配,这是因为搭配往往和语言产出的主题高度相关,而自动提取的高频率往往不受制于语境。比如 make money , college students, play basketball,efficient method, last summer, summer holiday 等。当然,人工识别还可以发现学习者的语块使用错误。以put up with our opinion为例,戚炎等(2015)将其归为“语外错误”。根据语境,该学习者想表达的语块并不是put up with ,而应该是put forward。再以in weekend为例,戚炎等(2015)将其归为“语内错误”。in weekend 用法并不存在,其正确用法是at the weekend (英国英语)或 on the weekend(美国英语)。此外,这些语块错误大多是形态错误,这大概率是因为学习者的母语-汉语没有形态变化。汉语和英语是类型学上的不同语言。这点同Wikorsson(2003)的发现一致,即语块受母语影响较强。(转引自王立非,2006)本研究中,中国二语学习者语块错误中的“语内错误”明显多于“语外错误”。关于语块错误的进一步探讨将另文展开。 当然,语块自动提取也有其优点,由于语料分析是基于语言大数据,所以所提取的语块往往更有代表性,当然前提是它必须满足语块成块条件。人工识别虽然能更全面且语块往往是有意义的,但是其识别过程耗时较长,更是往往因人而异、主观性强而受人诟病。此外,心理语言学认为语块既不是语法学家固定的,也不是根据频率决定的,而要看个体使用者的是否将其视为语块。(王立非等,2006)这就需要研究者因时制宜、因地(自然习得/课堂学习)将学习者视为语块加以使用,满足口语交际需要的语块,也就是所谓“纯需求分析”(Wray,2002 转引自 王立非等,2006),也包括在内。本研究中人工识别如此语块9个,包括一些学习者借用的句子(口语测试中提供用于展开思路的问句)、歌名“You Raise Me Up”、以及for the first question、try his best。
4.總结
类似二语习得领域的其它研究热点,语块应用研究的蓬勃发展(尤其是教学目的和使用特征)势必带来人们对语块定义/知识的进一步探索。语块知识的深入研究离不开语言学、心理语言学和神经语言学的协同工作。通过结合计算机和语料库技术对语块的自动提取和人工识别,本研究对大学生非英语专业理工类学生口语语料中语块使用进行定量分析。本研究倡导在语块识别中将采取多方印证的方法将主观性控制到最低,从而最大程度保证语块研究信度和效度,希望能有抛砖引玉作用。
参考文献
[1]Boers F,et al. Formulaic sequences and perceived oral proficiency:Putting a Lexical Approach to the test[J].languageTeaching Research,2006,(10):245-261.
[2]Ellis, R.The Study of Second Language Acquisition [M]. 上海: 上海外语教育出版社,1999.
[3]Nattinger J, DeCarrico J. Lexical Phrases and Language Teaching [M]. 上海: 上海外语教育出版社,2000.
[4]Stubbs,M.& Barth,I.Using Recurrent Phrases as Text_type Discriminators:A quantitative Method and Some Findings[J].Functions of Language 10/1,2003:61-104
[5]Wood D.Effects of fucused instruction of formulaic sequences on fluent expression in second language narratives: A case study [J].CanadianJournalof AppliedLinguistics,2009,(12):39-57.anguage 10/1,2003:61-104
[7]马广惠.英语专业学生二语限时写作中的词块研究[J].外语教学与研究.2009(1):54-60.
[8]马广惠.词块的界定、分类与识别[J].解放军外国语学院.2011(34):1- 4.
[9]胡元江.口语产出中的语块研究:回顾与展望[J].外语教学理论与实践.2011(2):57-63.
[10]戚炎、许翠芹.语块教学对大学生二语言口语流利性研究[J].外语界2015(6):26-34.
[11]肖更生、张再红.英文科技论文标题多维度特征研究—以SCI百篇高被引论文为例[J].中国科技期刊论文.2016(10):1055-1060.
[12]原萍与郭粉绒.语块与二语口语流利性的相关性研究[J].外语界.2010(1):54-62.
[13]王立非、张大风.国外二语预制语块习得研究的方法进展与启示[J].外语与外语教学.2006(5):17-21.
作者简介:黎杨(1979.08-),男,汉族,湖北武汉,研究生(硕士),武汉纺织大学,讲师,研究方向:大学英语教育