论文部分内容阅读
作为语言学的热门领域,类型学关注语言共性与语言类型。目前,随着信息技术与计算机科学的发展,大规模数据库、量化研究方法与多维研究视角在语言类型学研究中均扮演着越来越重要的角色。作为现代语言类型学的研究重点,语序类型学虽不断发展、日臻成熟,但仍值得从更多层面做进一步探讨研究。首先,作为跨语系的语言普遍规律,Greenberg(1963)提出的基本语序类型学标志着语序类型学的开端。在语言学定量转向的背景下,回归语序类型学的“概率本质”,进而探究跨语系语序共性与规律,显得尤为重要。其次,基于语序的量化指标,对印欧语系内部跨语族语言的类型学分类研究仍有不足。这方面研究能够更好地考察语序类型特征在语言类型学分类中的作用,揭示语言谱系分类与语言类型学分类之间的关系。最后,在印欧语系斯拉夫语族内部跨语支语言中,语序与形态之间的“复杂度折中”现象是语言作为“人驱复杂适应系统”的重要表现,也是语言协同演化的重要特征。对语言复杂系统的进一步探究能够更好地呈现人类有效编码语言的方式,从而进一步解释人类语言的个性与共性。基于上述背景,本研究从不同语系间的跨语系语序普遍规律、同一语系内的跨语族语序类型学分类以及同一语族内的跨语支语序协同演化三个层面,以离散与连续双重视角,基于大规模依存树库,使用计量语言学方法,提取跨语系、跨语族、跨语支的语序特征,考察三个研究问题:(1)在跨语系层面,双重视角下的语序量化特征能否验证基本语序类型普遍规律?(2)在跨语族层面,双重视角下的语序量化特征能否实现印欧语系内部各语族语言准确的类型学分类?(3)在跨语支层面,双重视角下的语序量化特征能否解释斯拉夫语族内部各语支语言语序量化特征的协同演化?研究结果表明,基于大规模树库和双重研究视角,计量方法能够很好地应用于语序类型学研究,并能从各层面准确捕获基本语序的普遍规律、类型学特征与协同演化。具体结果如下:(1)在跨语系语序普遍规律部分:在离散视角下,74种跨语系语言基于大规模树库的优势语序与这些语言在《世界语言结构图集》(WALS)中的优势语序无显著差异,并且树库能够为WALS中并不涉及的语言提供优势语序信息。该结果说明了基于树库提取语序信息的可能性与可行性。基于此,我们发现基于树库的优势语序信息能够证实蕴涵共性中的前四条,并对第五条蕴涵共性提出了质疑:符合该蕴涵共性“前件”的语言,并不满足其“后件”。然后,在连续视角下,我们同样发现,除第五条普遍规律外,各蕴涵共性所涉及的各语序关系之间密切相关。此外,混合效应模型能够对蕴涵共性进行建模预测,且预测结果同样对第五条蕴涵共性提出了质疑。上述结果表明,跨语系语序普遍规律在本质上并非绝对共性,而是一种概率倾向。(2)在跨语族语序类型学分类部分:在离散视角下,印欧语系四大语族(罗曼语族、日耳曼语族、印度-伊朗语族和斯拉夫语族)的11个平行树库中频率最高的语序关系与基本语序类型普遍规律中关注的语序关系高度一致,均位于齐普夫长尾分布的最前端。此外,五组主要二元语序关系的优势语序与WALS中给出的优势语序基本一致。该结果再次说明了使用树库进行语言类型学分类(离散分类)的可行性。在连续视角下,基于主要二元语序的频次信息与主要二元语序组合的依存方向均可对印欧语系各语族语言进行准确的类型学区分,且该类型学分类结果与传统的谱系分类结果非常接近。然而,基于主要二元语序关系的语序自由度指标却不能对印欧语系跨语族语言进行很好的类型学分类。该结果说明,各语族语言在语序类型学上既存在共性,又存在差异。在不同的类型学指标下,各语族语言的类型学分类结果存在差别。(3)在跨语支语序协同演化部分:我们以13种斯拉夫语族跨语支语言的24个树库为目标语料,以4种非斯拉夫语族语言的10个树库为基准语料,针对上一部分中“主要二元语序关系的语序自由度无法对语言进行很好的类型学分类”这一结果进行更为细致的探讨。在离散视角下,基于树库得到的优势语序结果同样能够为斯拉夫语族语言的主谓宾三元语序关系提供新的证据与参考,且斯拉夫语族各语支语言均表现出强烈的SVO优势语序倾向。在连续视角下,基于斯拉夫语族语言的主谓宾三元语序关系的语序自由度以及所使用树库的形态丰富度,我们发现三元语序关系的自由度确实比二元语序关系能够更好地反映斯拉夫语族内部各语支语言的语序灵活程度,也验证了语言学家关于“斯拉夫语族语言语序更为自由”的命题。同时,斯拉夫语族内部各语支语言的语序自由度与形态丰富度高度相关,这是对“复杂度折中假设”的验证。此外,古斯拉夫语族语言比现代斯拉夫语族语言的形态更加复杂,语序更加自由。换言之,现代斯拉夫语族语言除更少地使用形态标记外,语序也更为固定,越来越成为稳定的SVO优势语序语言。该结果说明语言是一个动态协同系统,人类倾向于使用“省力原则”编码语言,而这种编码方式正是语言在人的驱动下自适应、自调节的结果。以上结果展现了在依存语法框架下,基于大规模树库进行语序类型学研究的强大生命力和广阔可能性。基于上述研究结果,我们也更加清晰地意识到,语序作为语言——“人驱复杂适应系统”的一个层面,具有跨语系的普遍规律,也有跨语族的类型学特征,更有与其他层面互相协同、共同作用的动态表现。而这恰恰是语序类型学能为我们提供的对语言的最准确、最直观的认识,即验证语言类型规律、刻画语言类型特征、解释语言类型变异。本文从整体到局部,从宏观到微观,从语言谱系分类的三个层面考察基本语序的类型学特征。研究结果对于揭示语言的语序类型学规律,展现语言的共性与类型,解释语言的动态演化,促进类型学的定量转向具有深刻意义。同时,本文有助于丰富语序类型学的研究维度,拓展计量语序类型学的研究边界,对揭示语言的“概率本质”具有重要价值,能够为未来的语言学研究、跨语言比较、自然语言处理、机器学习等提供重要参考与广阔可能。