基于大规模树库的跨语言语序类型计量研究

来源 :浙江大学 | 被引量 : 1次 | 上传用户:blzzb001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为语言学的热门领域,类型学关注语言共性与语言类型。目前,随着信息技术与计算机科学的发展,大规模数据库、量化研究方法与多维研究视角在语言类型学研究中均扮演着越来越重要的角色。作为现代语言类型学的研究重点,语序类型学虽不断发展、日臻成熟,但仍值得从更多层面做进一步探讨研究。首先,作为跨语系的语言普遍规律,Greenberg(1963)提出的基本语序类型学标志着语序类型学的开端。在语言学定量转向的背景下,回归语序类型学的“概率本质”,进而探究跨语系语序共性与规律,显得尤为重要。其次,基于语序的量化指标,对印欧语系内部跨语族语言的类型学分类研究仍有不足。这方面研究能够更好地考察语序类型特征在语言类型学分类中的作用,揭示语言谱系分类与语言类型学分类之间的关系。最后,在印欧语系斯拉夫语族内部跨语支语言中,语序与形态之间的“复杂度折中”现象是语言作为“人驱复杂适应系统”的重要表现,也是语言协同演化的重要特征。对语言复杂系统的进一步探究能够更好地呈现人类有效编码语言的方式,从而进一步解释人类语言的个性与共性。基于上述背景,本研究从不同语系间的跨语系语序普遍规律、同一语系内的跨语族语序类型学分类以及同一语族内的跨语支语序协同演化三个层面,以离散与连续双重视角,基于大规模依存树库,使用计量语言学方法,提取跨语系、跨语族、跨语支的语序特征,考察三个研究问题:(1)在跨语系层面,双重视角下的语序量化特征能否验证基本语序类型普遍规律?(2)在跨语族层面,双重视角下的语序量化特征能否实现印欧语系内部各语族语言准确的类型学分类?(3)在跨语支层面,双重视角下的语序量化特征能否解释斯拉夫语族内部各语支语言语序量化特征的协同演化?研究结果表明,基于大规模树库和双重研究视角,计量方法能够很好地应用于语序类型学研究,并能从各层面准确捕获基本语序的普遍规律、类型学特征与协同演化。具体结果如下:(1)在跨语系语序普遍规律部分:在离散视角下,74种跨语系语言基于大规模树库的优势语序与这些语言在《世界语言结构图集》(WALS)中的优势语序无显著差异,并且树库能够为WALS中并不涉及的语言提供优势语序信息。该结果说明了基于树库提取语序信息的可能性与可行性。基于此,我们发现基于树库的优势语序信息能够证实蕴涵共性中的前四条,并对第五条蕴涵共性提出了质疑:符合该蕴涵共性“前件”的语言,并不满足其“后件”。然后,在连续视角下,我们同样发现,除第五条普遍规律外,各蕴涵共性所涉及的各语序关系之间密切相关。此外,混合效应模型能够对蕴涵共性进行建模预测,且预测结果同样对第五条蕴涵共性提出了质疑。上述结果表明,跨语系语序普遍规律在本质上并非绝对共性,而是一种概率倾向。(2)在跨语族语序类型学分类部分:在离散视角下,印欧语系四大语族(罗曼语族、日耳曼语族、印度-伊朗语族和斯拉夫语族)的11个平行树库中频率最高的语序关系与基本语序类型普遍规律中关注的语序关系高度一致,均位于齐普夫长尾分布的最前端。此外,五组主要二元语序关系的优势语序与WALS中给出的优势语序基本一致。该结果再次说明了使用树库进行语言类型学分类(离散分类)的可行性。在连续视角下,基于主要二元语序的频次信息与主要二元语序组合的依存方向均可对印欧语系各语族语言进行准确的类型学区分,且该类型学分类结果与传统的谱系分类结果非常接近。然而,基于主要二元语序关系的语序自由度指标却不能对印欧语系跨语族语言进行很好的类型学分类。该结果说明,各语族语言在语序类型学上既存在共性,又存在差异。在不同的类型学指标下,各语族语言的类型学分类结果存在差别。(3)在跨语支语序协同演化部分:我们以13种斯拉夫语族跨语支语言的24个树库为目标语料,以4种非斯拉夫语族语言的10个树库为基准语料,针对上一部分中“主要二元语序关系的语序自由度无法对语言进行很好的类型学分类”这一结果进行更为细致的探讨。在离散视角下,基于树库得到的优势语序结果同样能够为斯拉夫语族语言的主谓宾三元语序关系提供新的证据与参考,且斯拉夫语族各语支语言均表现出强烈的SVO优势语序倾向。在连续视角下,基于斯拉夫语族语言的主谓宾三元语序关系的语序自由度以及所使用树库的形态丰富度,我们发现三元语序关系的自由度确实比二元语序关系能够更好地反映斯拉夫语族内部各语支语言的语序灵活程度,也验证了语言学家关于“斯拉夫语族语言语序更为自由”的命题。同时,斯拉夫语族内部各语支语言的语序自由度与形态丰富度高度相关,这是对“复杂度折中假设”的验证。此外,古斯拉夫语族语言比现代斯拉夫语族语言的形态更加复杂,语序更加自由。换言之,现代斯拉夫语族语言除更少地使用形态标记外,语序也更为固定,越来越成为稳定的SVO优势语序语言。该结果说明语言是一个动态协同系统,人类倾向于使用“省力原则”编码语言,而这种编码方式正是语言在人的驱动下自适应、自调节的结果。以上结果展现了在依存语法框架下,基于大规模树库进行语序类型学研究的强大生命力和广阔可能性。基于上述研究结果,我们也更加清晰地意识到,语序作为语言——“人驱复杂适应系统”的一个层面,具有跨语系的普遍规律,也有跨语族的类型学特征,更有与其他层面互相协同、共同作用的动态表现。而这恰恰是语序类型学能为我们提供的对语言的最准确、最直观的认识,即验证语言类型规律、刻画语言类型特征、解释语言类型变异。本文从整体到局部,从宏观到微观,从语言谱系分类的三个层面考察基本语序的类型学特征。研究结果对于揭示语言的语序类型学规律,展现语言的共性与类型,解释语言的动态演化,促进类型学的定量转向具有深刻意义。同时,本文有助于丰富语序类型学的研究维度,拓展计量语序类型学的研究边界,对揭示语言的“概率本质”具有重要价值,能够为未来的语言学研究、跨语言比较、自然语言处理、机器学习等提供重要参考与广阔可能。
其他文献
随着环境和能源问题的日益突出,将价格低廉的可再生生物质材料作为增强填料开发新型生物质/聚合物复合材料,已成为世界能源可持续发展的趋势。3D打印技术是制造业领域的一种新兴工艺,在制造个人定制及复杂结构制品方面拥有显著优势,为生物质复合材料的高值化及多元化利用提供了机遇。为了高效利用生物质资源及开发功能性3D打印材料,本论文采用杨木粉、纤维素纳米晶体(CNC)等生物质材料填充热塑性聚氨酯(TPU)构建
学位
目的:建立脂多糖(Lipopolysaccharide,LPS)诱导小鼠乳腺炎动物模型、细胞模型及乳腺炎本源动物细胞模型。分析阐明甘草酸的抗乳腺炎作用机制。方法:(1)甘草酸抑菌体外实验甘草酸对造成奶牛乳房炎的主要病原菌大肠杆菌、无乳链球菌和金黄色葡萄球菌进行最低抑菌试验和杀菌效果检验。(2)LPS诱发的小鼠乳腺炎性损伤模型的建立(1)通过肉眼观察LPS刺激组雌鼠的乳腺组织的病理学变化;(2)对获
学位
"现象教学"的理念最早起源于芬兰,其为我国高中阶段的思想政治教学提供了新的教学思路,为我国的思想政治教学改革提供新方向。现象教学提倡从事物的整体全貌出发,通过解决跨学科的问题促使学生的思想得到提升和锻炼,促使学生的综合能力得到提高。"现象教学"的跨学科的特点与新时代核心素养的培养相契合,为学生的全面健康发展提供有力支撑。本文将从现象教学的含义以及发展路径入手,分析高中思想政治教学中的重难点问题,探
会议
随着技术的发展,民用设备尺寸越来越小,越来越轻薄,电子设备内部的温度变高,逐渐地开始使用叠层型电容器替代薄膜电容。特别是便携式产品当中,为了追求薄型化,电源电路板高度越来越低,元器件也开始进行低厚度化和表面贴装化的设计。同时在中高压领域,作为开关电源节省能耗的对策之一,使用叠层电容器能够在待机时间降低电力消耗。但是,在电源初级中,待机状态的基本频率是在几百至几千赫兹(包括很多电子电路也存在此频率段
期刊
【目的】增加种植密度是近年来我国乃至世界玉米(Zea mays L.)大面积高产的最有效途径,而玉米密植后倒伏问题严重制约了单产的突破。高密度种植条件下会引起茎秆外部形态及内部解剖结构发生变化,茎秆结构性化合物如纤维素、木质素含量会发生相应的改变。密植如何影响玉米茎秆形态建成、物质积累与分布,进而影响茎秆抗倒伏强度形成的?值得做深入探讨。因此,探究种植密度对玉米茎秆解剖结构及结构性化合物合成及酶活
学位
可溶性糖、有机酸和花色苷对葡萄果实风味和颜色起到至关重要的作用。氮和钾是葡萄生长发育所必需的营养元素,可以调节可溶性糖、有机酸代谢和花色苷合成。但是关于氮与钾调控葡萄果实糖酸代谢和花色苷合成影响的研究还不够系统。本研究以的‘弗雷’和‘巨峰’葡萄为试验材料(成熟的‘弗雷’葡萄果实为鲜红色,‘巨峰’葡萄果实为紫黑色),通过研究根施3种水平氮肥、叶面喷施两种钾肥和氮钾互作对不同发育时期葡萄果实的可溶性糖
学位
目的:花青素是一种水溶性色素,其在植物体内的积累和分布不但为植物花朵或果实提供艳丽的色彩和丰富的图案以诱引传粉者和种子传播者,还可以保护植物免受生物和非生物胁迫。此外,花青素因其抗氧化和抗突变性而被广泛用于食品和医疗行业。迄今为止,关于花青素生物合成和调控在模式植物和园艺植物中被广泛研究,但棉花中此类研究的相关报道还比较少。本课题组前期引进了1份陆地棉红叶种质资源(命名为HY),初步研究发现该种质
学位
果粮间作是新疆南疆地区的主要农业生产模式,南疆三地州果麦间作面积超过3.33×10~5hm~2(新疆统计年鉴,2017)。随着树龄的增加,进入盛果期后,树冠截光引起的弱光胁迫成为间作冬小麦大幅减产、营养品质改变的主要原因,严重制约了果粮间作模式的健康、可持续发展。因此,明确间作模式下果树树冠截光对小麦籽粒产量和品质形成的影响及其生理机制对于优化果粮间作模式、指导间作模式下高产栽培调控途径的研究有较
学位
绵羊消化道线虫(Gastrointestinal nematodes,GIN)感染是由多种线虫寄生于胃肠道引起,能够导致生长发育受阻、增重减慢、饲养报酬降低和养殖成本增加,严重影响养羊业经济效益。此外,防治上广泛使用驱虫药会产生大量耐药性虫株,以及在动物产品中造成药物残留,加剧GIN感染的危害。因此,在充分掌握GIN流行特征和规律的基础上,通过选择对GIN具有遗传抗性的个体,培育抗GIN品种,有助
学位
近年来,我国英语学习者的学习需求逐渐朝着个性化方向发展,而传统的反馈形式仅在最终的成绩报告中提供总分、排名等信息,通常不具有个性化特征,学习者往往难以从中明确自身的优势与不足之处。考分相同的学生在知识结构方面可能存在差异,其能力也未必相同(何莲珍2000),因而他们更希望考后能获取有关自己已经掌握的技能及有待提高之处的诊断信息,这就涉及到认知诊断理论(涂冬波等2008)。认知诊断的评估方法可为学生
学位