论文部分内容阅读
本文在自建笔语语料库的基础上,对汉语作为第二语言学习者的产出性词汇进行了考察,对比了学习者的产出性词汇与《汉语水平词汇等级大纲》词汇的异同,分析了产出性词汇量与语料覆盖率之间的关系。研究发现,初、中、高级水平学习者最大产出性词汇量分别为3630个、4882个、6938个。产出性词汇中超纲词较多。词汇在大纲中的等级越靠前,产出效果越好。学习者的产出性词汇与语料覆盖率之间呈现"效用递减律"。最高频的2000个产出性词汇可以覆盖大约90%的汉语二语语料,而这些词汇在同规模汉语母语语料中的覆盖率仅为71%。要读懂90%、95%的一般性汉语文本,分别需要大约6000个、10000个词汇。