论文部分内容阅读
句子是人类语言中最高层级的语法单位,而复句是最复杂的句子类型。众所周知,复句是一种不可或缺的语言手段,用来表达或传递更加完整与复杂的信息。学术界对英语复句的定义莫衷一是,但夸克(Quirk)等人在1985年编著的《英语语法大全》为英语复句所下的定义已普遍被学术界所接受,即至少包含一个主句(main clause)且同时嵌入一个或一个以上担任句子成分的从句(subordinate clause)的句子类型。嵌入的从句分两类,一类是担任主句中的一个论元,如主语、宾语等,称为补语从句(complementation clause)或名词性从句(nominal clause);另一类则是修饰主句或其中某个句子成分的从句,即形容词从句或关系从句(relative clause)以及副词从句或状语从句(adverbial clause)。前人对英语复句的研究在儿童语言习得中萌芽,在中小学英语语言教学中发展,在英语复句句法复杂度的测量中延伸,在机器翻译中进一步提升。研究对象从观察有限语料的个例向分析大数据研究语料的总体逐渐过渡,而研究范式则是逐渐从内省思辨到实验论证转向。大数据时代,与人工智能密切相关的自然语言处理迅速发展,对英语复句的机器翻译质量的要求不断提高,文本简化实现的多种路径研究应运而生,从而使得机器对英语复句的处理效率与准确性进一步提升。虽然我们对英语复句的研究在不断推进,但距离复句的“真相”实则还相差甚远,比如,在书面语中,作为英语复句典型标记的从句密度究竟有何特征?复句中的从句嵌入深度是如何分布的?假若我们对此类核心问题短见薄识,蝉不知雪的话,很难说对英语复句已经有了清晰准确而又宏观全面的认知,更难说机器翻译中对英语复句的文本简化会有实质性的突破。综上所述,我们借助Brown与LOB语料库以及自建的选自《纽约时报》20万词的新闻语料库,利用复句频次、复句句长、从句密度、嵌入深度、依存距离、依存方向以及层级距离等计量指标,对英语复句宏观与微观两个维度的诸多计量特征进行了全面系统的探究。由于受到句子长度和嵌入从句类型等多种因素的影响,复句的频次并非毫无规律或完全随意。撇开语体与语言变体的差异,宏观上看,复句频次占比为39.41%。简言之,在日常产出的十个句子中,会有四个句子是复句。如果考虑语言变体的因素,美式英语中的复句频次占比为36.78%,而英式英语则为42.05%,两种变体稍有差异,但差异值并不显著。此外,从语体差异的视角看,复句频次占比在20.18%与51.90%之间浮动,语体差异带来的影响有显著性。其中,在宗教、文学、传记和散文的语体中,复句频次占比最高,而在小说语体中则最低。这个差异可能与文本的严肃性或正式性密切有关。此外,影响复句频次的另一个关键因素即为句子长度。受到人们认知能力的限制,文本中的复句句长不会是任意增加的。研究发现,英语复句的句子长度的分布符合扩展正负二项分布。而且,语体差异会对其分布产生显著性影响。尽管如此,不同的语言变体对复句句长的分布则没有带来显著性影响。众所周知,复句由诸多从句嵌入而成,从句数量直接影响复句频次与句长的分布,而与从句数量紧密相关的当属从句密度与嵌入深度两个计量指标。从从句密度的维度看,在不同语言变体中,最大阈值均为9,而嵌入深度的最大阈值均为4。有趣的是,从句密度和嵌入深度的分布不受语体差异的显著性影响。更为重要的一点是,从从句密度和嵌入深度两个指标的拟合优度来看,英语复句存在句法复杂性的最小化趋势。复句中嵌入的从句类型多样,结构复杂多变。不同的从句类型可能会给相应的复句带来不同的句法复杂性的增加值。我们的研究发现,从句法复杂性的增加值上看,名词性从句、关系从句与状语从句三者之间有显著性差异。其中,名词性从句最大,可能与其在主句中充当核心动词的论元结构有关,而关系从句与状语从句最小且两者之间的句法复杂性相当。虽然名词性从句的句法复杂性最高,但其又包含诸多子类,子类差异可能会对名词性从句整体的句法复杂性带来不同的影响。以依存距离为计量指标的研究发现,名词性从句的诸多子类之间在句法复杂性上没有显著性差异。在句法复杂性相当的关系从句与状语从句两者之间,我们知道,相对于后者而言,关系从句则是以结构复杂与种类多样而深受众多研究者的青睐。我们从依存距离与方向出发,系统挖掘了对关系从句句法复杂性带来差异的诸多因素。从句长看,从句嵌入位置对其分布有显著性影响,而关系从句的依存距离与其嵌入位置无关。在对名词性从句、关系从句与状语从句实际使用的过程中,我们发现,关系从句的引导词常常伴有省略且比例较高。在依存距离,层级距离与层级数等三个计量指标的辅助下,我们的研究显示,依存距离是引导词省略的主要制约因素,而层级距离对其影响则微乎其微,但会受到从句层级数的显著性影响。当且仅当层级数为“1”,即关系从句的层级数最低时,从句的引导词才更易于省略。本研究提出并初步实践了英语复句研究的新路径,为英语复句研究带来了一些潜在的定量研究新方法,从定量实证的视角填补了英语复句研究领域的某些空白,新方法的尝试有助于我们对英语复句的宏观概貌有更加全面和清晰的认识。