基于SVM的汉语依存句法分析研究

来源 :中国海洋大学 | 被引量 : 0次 | 上传用户:xxxhot006
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
句法分析是自然语言处理的主要任务之一。本论文的目的和任务是对给定的自然语言句子,根据给定的语法自动识别其句法结构,并分析句子所包含的句法单位以及这些句法单位之间的关系。近几年,依存句法分析得到了越来越广泛的关注。根据研究得知,目前为止最有效的依存句法分析策略是基于分类器的训练算法和决策式的句法分析模型相结合。所以本文构建了一个基于SVM的汉语依存句法分析器。本文算法的基础是Nivre的Arc-eager决策式依存句法分析算法。但是此算法由于自身的缺陷导致了在处理长距离右依存时出现Early-reduce问题,本文会对算法进行改进。本文设计的依存句法分析器的主要思想如下:决策式分析算法根据当前的状态作出决策且不可更改,具有贪婪的特性,容易引起错误增殖。针对此问题,本文在分析句子之前做预处理来减少错误增殖。预处理工作主要有两步,首先采用机器学习方法SVM构建根查找器,利用根查找器找到根结点,用其将句子划分为两个子句;然后从子句中识别出介词短语,因为介词短语是引起句法分析器产生错误的主要因素之一,也是引起决策式算法分析长距离右依存时出现Early-reduce问题的原因之一。预处理工作可以降低句子的复杂度,减少错误的增殖,分析准确率也相应得到提高。最后即可进行子句的分析。汉语中,只有介词和动词具有右依存者,对于介词引起的Early-reduce问题,本文通过识别出介词短语来解决;对于动词引起的错误,本文引入全局特征,并定义了一个新的操作—Verb-Shift来处理动词的Early-reduce问题。最后本文对句法分析器的性能做了全面的测试和评估工作,实验结果表明,本文的分析策略使准确率得到了显著提高。
其他文献
近年来,随着计算机技术飞速发展和国际互联网的广泛使用,人们的许多数字化的产品非常容易被非法复制、窜改和伪造,使得很多产品版权所有者不愿意在网络上共享其作品,从而阻碍
近年来,直接体绘制技术已经成为三维数据场可视化的一种重要方法。由于它不需要借助中间几何图元,直接将体数据绘制到二维图像屏幕上,能产生高质量的图像,能够清晰地显示物体
Ad hoc网络是一种动态变化、无中心且基于无线信道的自组织网络。由于其组网灵活、机动性好、抗毁性强、可快速展开且无需固定基础设施支持等特点,Ad hoc网络技术已被各国军
安防技术的研究与应用对国计民生具有特别重要的意义,安防系统的应用已经逐步从工业、国防领域延伸到小区和民居。随着科技的发展,网络化已成为一个不可逆转的历史趋势,安防
人脸图像变形动画技术是计算机动画研究的一个重要分支。无论是电影电视、游戏娱乐、远程通信还是虚拟环境,人脸动画技术都被应用其中,为人们的交流、文化和娱乐带来极大的便
本文研究了含有控制时滞的汽车主动悬挂系统的减振控制问题,其研究内容概括如下:1、研究汽车在粗糙路面行驶中主动悬挂系统的最优减振控制问题。在考虑控制器时滞的情况下,利
近些年随着社会进步和科学技术的迅速发展,软件产品的应用更加广泛,已经涉及到社会的各个领域。与此同时人们对软件产品质量的关注程度也逐步增强,不论是软件的开发者还是软
近些年来,越来越多的学者和研究人员关注智能优化领域,智能优化算法因而得到广泛地研究,并且应用到多个领域,例如生物信息学、数据挖掘、模式识别、城市规划和软件工程管理优化,等
三维地质建模是运用计算机在三维环境下进行地质分析的技术。传统的地质信息模拟与表达只是将三维空间信息在某一平面上进行呈现,存在空间信息损失与失真、制图过程繁杂和更
随着社会的发展和技术的进步,人们越来越意识到海洋在人类社会发展进程中的重要作用。海洋为大类提供广阔的发展空间和资源优势,对于海洋进行一定深度和广度上的开发成为世界