论文部分内容阅读
本文以前人對常用詞研究的成果為理論指導,借鑒現代漢語詞頻統計的成功經驗,對西周早期至西周中期的231條金文和整個先秦時期9部可靠的傳世文獻的用詞情況首次作了比較全面的整理和統計,得到了四個階段五個部分的詞彙總表。四個階段是:西周早期至西周中期、西周中期春秋末期、春秋末期至戰國中期、戰國中期至秦代.五部分語料是:(1)西周早中期的231條金文;(2)《詩經》(部分)、《周易》本經、今文《尚書》(部分);(3)《詩經》(部分)、《春秋經》;(4)《論語》、《商君書》、《左氏傳》;(5)《孟子》、《莊子》、《呂氏春秋》。詞彙總表是常用詞確定的依據,共包括五個部分的内容:序號、詞目、頻次、頻率和覆蓋率。本文以詞彙總表中詞的覆蓋率為主並結合詞的使用頻次確定了先秦四個階段五部分語料的常用詞,分階段討論了常用詞的特點以及它們在整個先秦時期的發展情況。全文除結語外,由七個部分組成。緒論部分介紹了本文所用常用詞的含義、選题的背景和研究的意義,並對前人的研究情況進行了回顧與總結,另外交待了本研究的使用的理論、材料、方法以及研究思路。第一章重點討論詞的切分、詞和詞組的分別以及詞位的確定。本文使用由大到小的層次分析法從文獻中切分詞。為保證最後得到的單位確實是詞而不是大於詞的詞組或者小於詞的語素,文章还詳細地討論了確定詞的各項標準以及這些標準的適用範圍,分析了一些難於處理的情況。另外,根據本研究的實際需要,引進了詞位和詞位變體兩個概念,指出從文獻中切分出來的單位是詞位變體而不是詞位,詞位變體發生在詞的書寫形式、讀音形式、功能和意義四個方面。進行詞頻統計當以詞位為單位。確定詞的詞位,最主要的是要把有各種變體的單位當作一個詞來處理,而把形式上相同、意義毫不相關的詞分開作不同的詞處理。第二章至第五章分別介紹先秦四個階段的語料情況、各階段的詞彙總況以及確定各階段常用詞的標準,並對五部分語料常用詞的特點進行了分析。第六章主要討論先秦時期常用詞的發展情況。首先對一些重要的數量關係作了梳理,據此分析了文獻用字量、用詞量、總字數、詞彙總量、頻次、覆蓋率和常用詞之間的關係。然後從先秦各階段常用詞數量上和内容上的變化兩個角度,分析了影響各階段常用詞數量變化的原因和常用詞内部常用度高低的情況。文章指出,常用詞數量的多少跟文本量大小密切相關,不同階段常用詞的數量雖然有多有少,但不會出現太大的變化。常用詞為了保持數量上的這種平衡性,當一部分常用詞補充進來以後,就會把原有的一部分常用詞擠出去,這種發展模式表現在數量上是滾動式的而不是累增式的,表現在内容上是更替式的。常用詞内部存在著等級的差別,為各個時期共有的常用詞,其常用度最高,只為某個時期獨有的常用詞,其常用度最低。從時代上看,時代靠近的文獻,共有的常用詞的數量多,時代相隔的文獻,共有的常用詞的数量少。第六章最後以三個專题的形式,從複音虛詞的形成、常用詞在各個階段義位的變化和常用單音節詞在構詞當中的作用三個方面,對先秦漢語常用詞的發展變化情況作了個案研究。