支配词一致性原则与语言分类优化

来源 :浙江大学 | 被引量 : 0次 | 上传用户:jinglwwb33
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本研究采用计量研究方法,试图解决词序类型学中有关支配词一致性原则的争论,并优化利用依存方向进行语言分类研究的方法。为此,我们基于21种印欧语的依存树库,提取了10种词序特征值,并利用支持向量机模型对语言分类的效果进行评估。一方面,我们统计出各个词序特征的比例,进行了交叉性相关分析。这不仅检验了已知的与动宾组配共现的关系对,而且为语言使用中的支配词一致性原则提供了大规模、跨语言的证据。我们进一步发现同向的依存关系(支配词居前或支配词居后)倾向于聚集在一起。另一方面,本文运用了两种提高词序类型学分类精度的方法——细化依存关系或将依存距离设为依存方向的权值。我们发现形容词和名词组配的分类效果最为理想,而传统的动词和宾语组配的分类结果不佳。这表明对依存关系进行精细化处理可以提高语言分类的精度。此外,本研究提出了加权依存方向的指标,发现在长距离依存关系受限的前提下,这一指标比依存方向的分类效果更好。为证实以上两种方法的可靠性,我们对两种潜在的干扰因素(树库大小和句长)进行了讨论。结果表明,这两项文本特征并不足以对词序特征产生显著影响。尽管依存方向和加权依存方向均与句长相关,但两项指标依然比较稳定。
其他文献
<正>为充分发挥人大代表在脱贫攻坚工作中的引领作用,南雄市古市镇人大根据代表的职业和身份不同,将8名市人大代表、53名镇人大代表分为领导干部代表、农村党员代表、致富能
采用反复冻融和超声波破碎法破碎17种微藻细胞,通过细胞破碎率和抗菌活性检测破碎效果,以选择适合不同微藻的破碎方法,利于胞内活性物质的提取.细胞破碎结果显示:经过12 min的
1998年3月5日是周恩来同志诞辰100周年的纪念日,全国各大报纸都在显著位置刊发了右恻的照片,照片说明是:"1957年8月10日,周总理在海军司令肖劲光大将的陪同下检阅北海舰队。"
期刊
<正>泉州、潮州、海丰、陆丰、泰山、三峡、长治……凡此种种,不一而足,由于历史文化的渊源,台湾有许多地方与大陆同名,因此,当你走进乡野村镇,深入台湾腹地,你会发现两岸原
我国宪法的适用性表现在以下五个方面:宪法对宪法适用作了总括性规定:我国违宪审查制度一方面明确了全国人大和全国人大常委会可以适用宪法,另一方面违宪审查存在的前提之一就是
本文的研究对象是中美选秀节目中的礼貌补救策的语言选择。礼貌是一种语用现象,也是一种社会现象,广泛运用于日常生活与工作中。近年来,礼貌问题引起了许多语言学者的关注。
资本市场理论发展至今,传统的线性范式正面临非线性范式的严峻挑战。所谓线性范式指的就是以有效市场假说为基础,以线性函数关系为模型的资本市场理论框架。但是实证研究表明,资
儿童用怎样的语言形式来表达定指与不定指成分,是其语言能力发展的重要方面。首先他们不仅要习得分别用于表达定指与不定指成分的词汇类型及句法结构,同时也要获得一定的语用
对0、30、150、300、450和600μmol·L-1Pb胁迫条件下狭叶香蒲(Typha angustifolia Linn.)种子的萌发特性进行了研究,并分析了0、450、900、1 800和2 700μmol·L-1Pb胁迫对
采用CHNS面板数据和随机效果单位概率模型分析决定我国城镇失业率的主要因素。16-26岁青年失业率决定因素的实证结果显示:年龄的增加会降低失业概率,年龄对失业概率的边际效