论文部分内容阅读
词表,对于语言学理论、语言教学、中文信息处理等领域都具有极其重要的价值和意义。词表研究,也因此成为众多学者历来关注的重要课题之一。本文针对从2002年10种主流报纸中提取的两个词表——流通度词表和使用度词表进行了多角度的比较分析,最后得出结论:以流通度为标准提取的词表由于加入了发行量和媒体等系数,在内容和顺序上更能反映报纸的动态变化,更加科学实用。 本文主要对两个词表前3000的词语进行了比较,如果把使用度词表作为初表,对比后我们发现流通度对使用度词表进行了较大幅度的调整,使用度表前3000中有65.63%的词语到了流通度表中仍然保持在前3000的行列,34.37%的词语到了流通度表中则跌出了前3000,同时有1031个本来在使用度表中位列3000以后的词语进入了流通度表前3000。在新进入的词语中,具有显著领域特色的词语大量涌入,涵盖经济、政治、休闲娱乐等多个方面;从词性角度看,标识类名词数量众多,代词和形容词数目偏少。在跌出去的词语中,形容词数量较多。在保留下来的词语中,有三类词语特点明显:网页信息类、报纸栏目名称类和报纸属性信息类;从词性角度看,代词和几种虚词更为引人注意。在对词表观察分析时我们发现,报纸发行量、发行地域等“媒体系数”在调整词表的过程中发挥了重要作用,这体现了流通度的重要思想——媒体流通度会直接影响到文本的流通度,文本的真实流通才会对大众语感产生影响。除了分析词表的变化,我们还对“语结构”进行了专门的研究并得出结论:流通度词表中的语结构更好地兼顾到了统计和语感两个方面的因素,因此更有实用价值。为了验证文章结论是否正确,我们还进行了一定范围的语感验证,验证结果与我们之前得到的结论非常吻合,这也是对流通度理论的有力佐证。 本文的语料来自北京语言大学DCC动态流通语料库。采用语料库技术,同时参考大众语感。希望通过本文可以体现流通度理论在科学性和实用性上的优势,同时,也希望我们的结果能够为对外汉语教学提供一些借鉴和参考。