基于依存语法的汉语句法分析研究

被引量 : 0次 | 上传用户:mxf12
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
句法分析是自然语言处理基础研究中的一个关键技术之一,是衔接词法分析与语义分析的桥梁。本文的目的是从汉语自身特点出发,以现有的句法分析理论和方法为指导,研究和开发适合汉语的句法分析技术。句法分析技术指的是依据语法规则来确定句子结构的分析方法。依存语法是当今句法学研究的前沿和热点问题之一,本文的句法分析采用的语法体系就是依存语法,采用的句法分析技术是决策式依存句法分析方法。Niver算法作为决策式句法分析方法己经成功的应用于英文的依存句法分析,因为英文和中文在句法特点上具有一定的相似性,所以本文采用Nivre算法进行汉语依存句法分析。本文首先对现有的一些依存句法分析方法从处理策略,算法的时间复杂度等方面进行了综合分析和比较,其中详细研究了Nivre算法,然后针对该算法,本文提出了进一步的改进。Nivre算法在分析长距离右依存时会出现错误,在汉语中,只有动词和介词跟他们的依存者具有右依存关系,所以错误主要发生在动词和介词的依存分析上。本文依据汉语介词短语的特点,提出了一种改进的Nivre算法,让除了介词外的介词短语部分先进行依存分析,最后再是跟介词之间的依存分析,来减少介词的长距离依存问题,提高汉语依存句法分析的正确率。实验数据采用含有1万个句子的哈尔滨工业大学的依存关系语料库,采用基于支持向量机(SVM)的句法分析器MaltParser作为本文算法的实现工具。结果表明,使用改进后的Niver算法进行汉语依存句法分析,正确率提高了1.72%,对介词的长距离依存取得了比较好的分析结果。
其他文献
本文采用我国30个省市的面板数据,实证研究了贸易开放是否与其他配套性政策形成有效协调,从而共同作用于我国的经济增长。第一类配套性政策指标包括人力资本、金融发展水平、
20世纪90年代中期以来,随着新经济的发展和经济全球化进程的加快,世界范围内掀起了跨国并购的第五次浪潮。与以往的并购高潮相比,此轮并购浪潮在并购主体、动机、方式以及行
儿童文学在文学系统中易被忽视,而翻译儿童文学在文学系统中占据着更加边缘的位置。然而,自上世纪80年代以来经济社会的巨大变化,儿童观也转变为儿童中心论,市场上充满了大量
近些年我国发生着日新月异的变化,城市化脚步锐不可挡,这也为城市道路建设提出更高要求。随着道路建设规模不断扩大,生态环境问题被提上日程,受到了各界普遍关注。如何能够满
由于农村经济自然条件与经济条件的欠缺与落后,造成了幼儿教学相对落后。本文根据农村幼儿教育发展中的问题分析,提出了解决农村幼儿教育发展的对策。
改革开放以来,金融业取得了长足的发展,金融服务产品的性质和内容也发生了巨大变化。特别是最近20年来,以高知识密集、高资本密集、高附加值和高管理水平为特点的金融业愈发
随着经济的快速发展,城市化进程速度的不断加快,城市交通问题愈来愈严重。优先发展公共交通是缓解城市交通拥堵、减少交通污染的有效手段。公共交通的价格策略是城市公交优先
本文在对20世纪60年代以来国外关于度量贸易开放度文献综述的基础上,通过回归分析,运用修正的道拉斯法和修正的对外贸易比率法,对中国的贸易开放度进行了重新估计,结果得出了
红枫湖、百花湖和阿哈水库简称“两湖一库”,“两湖一库”是贵阳市和周边人民主要的生活饮用水以及旅游、养殖、发电及工农业用水水源。建库40多年来,随着工农业的迅速发展和
<正>随着社会的日益发展,教育改革也在不断地进行,教师们都在积极探讨各种教育教学理念。所谓"生本"就是以学生为本,即"为了一切学生,一切为了学生,为了学生的一切"。学生是