商务英语词汇的量化研究

被引量 : 1次 | 上传用户:X_DotNET
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
商务英语的词汇特点是专业理论知识的基本要素,对建构整个理论知识体系至关重要。英语词汇的量化描述对英语教学与研究、机器翻译、自然语言处理等领域有重要意义。计量语言学家对普通英语和科技英语的语篇词汇量化特征有深入的研究,但对商务英语词汇则很少或没有相关研究。本文基于语料库,运用计量语言学的理论和方法对英国国家语料库中商务英语语域的词汇特征进行定量和定性分析。以容量为100,000,000单词的英国国家语料库为语料来源,并从其商务英语语域中随机抽取了2,000,000单词,研究其词汇的量化特征。作为参照,本研究还从英国国家语料库另外8个语域中分别随机抽取了8组样本,每组2,000,000单词,由1,000个语篇组成,每个语篇长度约为2,000单词。研究内容包括商务英语的词汇量、词汇密度、词汇增长、词频分布、商务英语单词熵、大学英语四级和六级词汇对商务英语的单词覆盖率、Brunet和Tuldava等数学模型对商务英语词汇增长曲线的拟合度。本研究运用Perl编程并进行抽样、数据提取、处理、及词汇增长和数学模型计算等。运用Visual Foxpro进行词目归并。NLREG为统计分析软件包,用于各种统计测试、计算及分析。该研究表明:1.总体上,在BNC 9个语域中, CDBNC与其它8个语域有着显著差异。CDBNC的词汇量,一次词和词汇密度最小。在CDBNC的30,044词汇中有10,622一次词。2CDBNC的200个高频词有两个特点:首先,他们具有明显的商务英语的特点;第二,(CDBNC的200个高频词中的核心词无法进入到普通英语中200个高频词行列。3.与BNC中的其它8个语域相比,CDBNC的单词熵和复杂度较小。4.相同长度文本TTR呈正态分布:随着文本长度增加TTR变小。这种变化可用Tuldava模型来描述。5CDBNC中的大学英语四级和六级词汇的覆盖率呈正态分布。四级平均词汇覆盖率为0.7747,六级平均词汇覆盖率为0.8170。四级和六级篇际词汇覆盖率明显高于四级和六级的词汇覆盖率,四级平均篇际词汇覆盖率为0.872,六级平均篇际词汇覆盖率为0.8955。6. Brunet’s模型对CDBNC的词汇增长率的拟合度很好。
其他文献
在建设社会主义新农村过程中,国家加大了对农村建设的各项政策扶持和财政支出力度,特别是在农村公共产品供给方面,逐步建立起农村公共产品经费保障机制。但是与之对应的是,农
从归纳整理现有民间资本研究成果入手,对民间资本投资领域、与区域经济发展的关系、民间资本投资的影响因素及优势、民间资本投融资模式、规范监管制度等五个方面的现有研究
作为一个工业生产大国,我国危险化学品的产量、流通量增长迅速。危险化学品由于其自身的化学性质,往往具有易燃、易爆、腐蚀性等危险特性,在生产、装载、运输等环节容易发生
义务教育物理课程主张“从生活走向物理,从物理走向社会”,培养学生的探索兴趣和科学实践能力。利用常用的实验器材,开发低成本物理实验资源并应用于教学活动之中,是实践义务
大兴安岭地区是我国东北地区主要冻土分布区,位于最北边疆,是我国唯一的寒温带针叶林区,湿地与冻土相互作用,导致它们独特的共生模式,同时由于位于欧亚大陆多年冻土带的南界,
死刑在本体论上的含义是掌握公权力的主体以公共利益或他人的利益受到损害为名义,而利用其掌握的公权力实施的、对造成公权力主体自认为除行为人本人以外的其他客体具有严重
目的探讨外阴阴道假丝酵母菌病患者应用硝呋太尔制霉素阴道软胶囊治疗的临床效果。方法抽取我院2016年6月~2018年3月收治的外阴阴道假丝酵母菌病患者93例为研究对象,45例行克
风电机组运行过程中,由于风速是经常变化的,风力发电机组也必将受其影响而时刻处于变速运行之中;另一方面,不稳定的电网和发电机发生故障时都会在发电机转子上施加瞬时电磁扭
本论正文部分分为两个版块:厥阴病的体质心理学与厥阴病的证治规律研究,本人通过逻辑推理以及反证法,结合临床实际,深度挖掘了厥阴病有关的内容,澄清了许多历史疑难问题,又提
本文从国际法的角度出发,积极探索防空识别区存在的合法性的依据,并进一步说明中国设立防空识别区合法性。本文除引言和结论外,一共分为四个部分。第一部分是对防空识别区制