语料库的代表性——语料库设计中影响语料库代表性的因素

来源 :武汉大学 | 被引量 : 0次 | 上传用户:sharp_z
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文讨论了语料库设计阶段的五个因素,即抽样方法、语言总体定义、库类别、库结构、库大小,如何影响语料库的代表性,重点是对库大小因素的分析,因为在现阶段只有在这一方面能进行实证研究.在第一章,作者首先简要地定义了语料库和语料库的代表性,提出在设计阶段正是以上五个主要因素影响着语料库的代表性,并且论述了研究这些因素在理论和实践上的意义.在第二章,作者比较了简单随机抽样和分层抽样各自的长处,得出结论:后者要比前者更能反映语言总体,因而被当作是语料库建设的标准抽样方法.在第三章,作者首先讨论了语料库设计中语言总体定义的重要性和困难,然后提出在定义过程中要注意语言产生和接受、外部标准和内部标准两个区分,并且得出结论:在语料库设计阶段定义语言总体时,对语言产生和接受都要考虑,而且主要遵照非语言的外部标准.作者还介绍了如何从时间、地域、社会语言学、类别等四个方面对语言总体进行定义,以及如何利用现成的印刷品、文件等的目录和索引建立抽样框架,作为抽样时使用的语言总体的成分清单.第四章比较了静态语料库和动态语料库的优点.第五章探讨了如何设计语料库的结构,使其更具代表性.在第六章,作者认为,语料库的大小因素既涉及语料库的总词数、总文本数(总体大小),又包括各个文本类型内的文本数(文本类型大小),还跟单个文本的长度有关.关于文本的大小,作者认为一个具有代表性的静态语料库应该收集等长的文本.该文的第七章是对全文的一个总结,并且提出了在语料库设计中代表性问题研究的下一步的方向.
其他文献
该文从语用学角度对翻译进行了尝试性研究,探讨了语用学对翻译的理论发展及实践应用的启示,旨在揭示语用学对翻译的丰富解释力,为翻译研究提供新的视角.翻译活动从本质讲是一
学位
与其他领域类似,化纤机械的改造业务对于主机厂而言也并非主流,不过在用户看来,改造投资少、机动性大倒也不失为迅速迎合市场的不错选择.rn改造三大出发点rn谈到常见的化纤设
本文用定量的方法研究了中国外语学习者在系统的大学外语教育停止后的外语水平变化情况。 本文采取纵向的研究方法,通过在三个不同的时间点上考察来衡量学习者的外语水平变
本文作者从语言功能(信息功能、祈使功能、美学功能和表达功能)以及语言的形式和内容两个角度对收集的22篇广告的中英文版本进行了对照分析。结果显示,从语言功能角度出发,中文
该文在研究传统修辞学的基础上尝试从语用和认知的角度来全面地分析反语现象的使用和理解,并从交际中的例子着手研究反语的应用及其在英语和汉语中的异同.该文认为,反语是人
期刊
改造精英rn常州宏大:改造升级空间巨大rn常州宏大科技集团在印染自动化控制领域中,可谓创新密度较大的企业.该公司董事长顾仁表示,得益于十多年专注的在线检测技术研究,企业
转型升级,我们大多在谈更新换代,而很少谈及老机改造。但实际上,目前国内纺织服装行业总体上“改造”的面还是占很大比重的。据分析,未来,我国纺织产业发展将由“增量投资”
“如何以《国企领导人员廉洁从业规定》等相关制度规范自身,以身作则”“如何发扬民主,规范用权,在职工中做廉洁从业的表率”“如何尽快转变角色、找准定位,加强与部门间沟通交流