基于图和转移算法相结合的中文依存关系解析

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:ahaulxg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
句法分析是自然语言处理的重要任务之一,近年来得到广泛重视,在机器翻译、信息检索、自动文摘等领域有着直接的应用。依存关系解析是句法分析的一个重要方法,依存关系可以明确地表明词与词之间的句法依存关系,并方便地转化为语意依存描述。词是句子结构中的最小元素,词与词之间的依存关系解析可以表示词间的深层联系,本文在基于词的基础上进行依存关系解析。目前,英文依存关系解析与日语依存关系解析已经取得了较好的研究成果。中文的语法结构不同于其他语言,依存关系解析较复杂。目前的中文的依存解析方法主要分为两种:基于转移的方法和基于图的方法,基于转移的方法的主要代表方法是Nivre算法,而基于图的主要代表方法是最大生成树解析算法。Nivre算法是一种确定性的解析方法,基于待解析词对的周边特征进行解析,采用贪婪算法,在每一步都寻求局部最优解,中间结果可以用于随后的解析。最大生成树解析算法是基于整句的依存关系树进行解析,搜索的是全局最优解,最大生成树未解析完毕,不能确定任何中间结果。本文根据Nivre算法和最大生成树解析算法的互补关系提出了两种结合方法。一种是以最大生成树算法为基础,通过Nivre算法结果的存在性修正最大生成树边值的算法,称为基于存在性影响因子的中文依存关系解析;另一个结合方法是以最大生成树算法为基础,通过Nivre算法结果的依存度修正最大生成树边值的算法,称为基于依存度影响因子的中文依存关系解析。实验采用宾州中文树库5.0,实验结果表明,本文提出的两种结合方法均好于原单一算法。基于依存度影响因子的算法的解析效果最好,精确率达到86.87%。
其他文献
借助于虚拟化的计算能力,存储资源以及现代Web技术,云计算能够为用户提供可扩展的、以网络为中心的、抽象的IT基础设施,平台以及各种各样的应用。随着云计算应用领域的不断深
作为数字证据分析技术的一个重要组成部分,Email群体分析技术可以让人们通过电子邮件这一媒介,间接地揭示社会群体中的社会关系。Email群体分析技术的主要思路是:通过分析Ema
移动Ad-hoc网络(MANET)是一种特殊的没有控制中心的无线网络。它由一组无线节点组成,不需要依靠现有固定通信网络基础设施、能够迅速展开使用的网络体系,网络中的节点兼有主
掌纹识别是通过手掌皮肤的纹路特征来进行身份识别的方法,是在传统身份识别方法上的一种创新,已经成为身份识别领域的热点研究对象之一。目前,掌纹识别技术的研究主要集中于
2006年夏天,我到四川省甘孜州炉霍县,沿着红军长征中朱德同志的足迹,缅怀他的丰功伟绩。1936年3月7日,红四方面军攻取炉霍县城(原老县城)。朱德和张国焘、红军总司令部、总政
2003年9月,中共江苏省委组织部将射阳县确定为党代会常任制改革试点县。10月,县里重新登记核发了新的党代表证,并于年底召开了第二次党代表大会——射阳县党代会常任制下的第
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
一、要充分认识学习《江泽民文选》的重大意义江泽民同志是党的第三代中央领导集体的核心,是“三个代表”重要思想的主要创立者。党的十六大把“三个代表”重要思想同马列主
JavaScript在Web中得到了广泛应用,提高JavaScript程序的处理能力显得尤为紧迫,由此看来提高JS引擎的性能对JavaScript的发展将有重要意义。针对嵌入式平台多样性和硬件复杂
随着第三代移动通信技术的快速发展,使一些包含信息量较大的基于位置服务(location-based services,LBS)通过无线网络提供给用户成为可能。基于位置服务给人们生活带来了极大