论文部分内容阅读
本文研究了复句关系标记在真实语料文本中的使用状况与分布概貌,考察了关系标记搭配的基本情况与关联规律,探讨了复句关系标记搭配格式的句式特点与语义问题,并对相关的搭配现象做出了合理的解释。论文的研究有较大规模语料样本和数据库作为数据支持,得到的结论能够反映关系标记在一定性质的语料中的使用情况。研究过程中重视对语言事实的全面考察,重视对客观数据的统计分析,减少了研究的片面性与主观性。本文既有对理论方法的宏观思考与探索,又有对典型个案的微观描写与分析,而且将现代语言学的先进理念和朴学精神结合了起来。文章以“小句中枢理论”与“搭配理论”为背景,综合运用了“两个三角”研究方法、搭配研究方法、统计手段以及聚类分析等多种跨学科研究方法。运用的理论、方法反映了学术研究的最新动向,同时力求结合汉语的实际情况,具有方法论的意义。 本文研究了以下几个基本问题: 第一章探讨了“小句中枢理论”在中文信息处理领域的应用,介绍了“汉语复句语料库”的建设情况。“小句中枢理论”在汉语词语的自动切分和标注、短语的识别和标注、歧义的消解、语法实体复杂特征集的描写等中文信息处理领域具有应用价值。“汉语复句语料库”是一个专用语料库,是进行汉语复句研究的大平台,该语料库给本文的研究提供了非常重要的数据支持,本章对“汉语复句语料库”的规模、性质、语料来源以及建设与利用情况作了简要的介绍。 第二章系统地介绍了搭配研究的理论框架、搭配研究发展的几个重要阶段,并对国内搭配研究开展的情况、取得的主要研究成果作了简要的介绍和评价。本章重点探讨了汉语复句关系标记搭配研究的意义、研究内容、并结合汉语复句的实际情况介绍了搭配研究基本的手段和方法。本文对搭配研究的一些方法进行了合理的改造,例如,将关系标记的搭配看作是单向的搭配关系,将搭配的语境扩展到小句以外等等。本章还讨论了关系标记搭配距离与“语义韵”等问题,最后,对研究使用的语言资源作了介绍和说明。 第三章对复句关系标记成员作了比较详细的归纳、整理,并以较大规模的真实语料为样本统计了关系标记的单现频率与各类标记的分布情况。本章重点研究了关系标记的搭配强度,分别使用了计算MI值与Z值的评估方法对常见的搭配格式的搭配强度进行了统计分析,并比较了两种方法的异同,探讨了搭配强度对关系标记语义衍生所产生的影响。本章还统计了常见搭配格式中关系标记的平均搭配距离,将搭配距离作为“语表形式”分析了两个复句格式的“语表”、“语里”与“语值”的关系。关系标记搭配的“语义韵”是本章的又一个重要内容,论文探讨了关系标记搭配“语义韵”的判定方法,并以因果标记“多亏”为例进行了个案分析。