论文部分内容阅读
影响语料库代表性的主要因素有:语料库总体的定义、语篇的分类和层次、语料库的规模.建立具有代表性的语料库,首先必须从时间、地域、社会语言学、类型等方面对语言总体进行明确地限定;设计语篇的抽样层次必须对语料进行多维、全面地分类,并确定各层次和部分的合理比例;决定语料库的总体规模应该考虑建库的目的以及财力和技术的限制,确定语篇类型的大小和单个语篇的长度,主要依据所研究的语言现象的常见程度.