动词次范畴化驱动的汉语句法分析

来源 :黑龙江大学 | 被引量 : 0次 | 上传用户:laoxu111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
句法分析是自然语言处理领域的一个关键性问题,句法分析的任务就是根据给定的语法自动推导出句子的语法结构。句法分析性能的提高对机器翻译、信息检索、信息抽取、语音处理等应用产生重要的推动作用。汉语的句法分析技术是中文信息处理的基础,由于汉语在语法上独有的一些特点,对汉语的分析造成了一定的影响,使我们不能照搬现成的像英语句法分析的方法,要从汉语自身特点出发,研究适合汉语的句法分析技术。对汉语句法分析的研究将对自然语言处理的各种问题提供帮助,是解决自然语言理解的重要手段之一。本文首先简单介绍了句法分析的相关理论和相关技术,介绍了句法分析算法和模型。又简单介绍了动词次范畴化的概念以及形式化描写方式,以及汉语句法分析与动词次范畴化之间的关系,在此基础上提出了基于次范畴化规则的句法分析方法和基于次范畴化统计特征的汉语句法分析方法。我们在基于次范畴化规则的句法分析方法中引入了最大相似度的手段,提出了利用动词次范畴化信息对栈内规则的模式进行相似度匹配的方法实现了对汉语句子的句法分析;在基于统计的句法分析方法中应用了取概率平均值的措施,通过对栈内句法分析规则和次范畴化规则的概率取平均值的方法对汉语句子进行句法分析。我们通过上述两种方法得到的分析结果与基准方法相比有了很明显的提高。
其他文献
随着网络技术的发展和计算机在各个行业的普及,每天都有海量的电子数据需要存储和管理。电子数据由于其自身特点,在存储过程中极易被篡改、伪造、破坏或毁灭。人们使用了安全备
蛋白质折叠预测在生物信息学领域是非常关键的问题,蛋白质折叠解释了不同的生物现象,可以用来预测以及控制这些生物学现象。为了模拟蛋白质折叠的形成过程,近年来许多学者提
目前,各航天大国越来越趋向于使用体积小、重量轻、无转动部件、高可靠性的NAND闪存做为空间数据记录器的存储部件。通常,一个闪存分成若干块,每个块又分成若干页。块是擦除
近年来,由于网络的大规模发展,流媒体视频直播已经渐渐成为互联网核心业务之一,因而也有越来越多的关注。也有很多成功的商业系统向大家展示了流媒体视频直播的可行性。然而,
随着软件技术的飞速发展以及软件应用的广泛普及,用户对软件的可靠性和安全性提出了更深层次的要求。软件测试是保障软件质量、确保程序正确性的必经流程和必要手段。但是随着
随着传感器技术、嵌入式计算技术、分布式信息处理技术和通信技术的迅速发展和日益成熟,推动了具有划时代意义的无线传感器网络的产生和发展,其目的是协作地实时监测、感知、采
近年来,随着微机电系统与无线通信技术获得长足发展,已涌现出许多种类的无线网络。这些网络的发展主要集中于提升数据传输率与降低网络能耗,而在某些能量受限的应用中,能量的有效
随着互联网和通讯产业的快速发展,各种形式的信息扑面而来。而短文本(通常文本长度小于160字符)作为手机短信息、在线即时聊天记录、论坛用户评论等信息的主要表现形式,已经成
随着全球经济的迅速发展和市场竞争的日益激烈,企业正面临着更大的挑战和机遇,而供应链管理作为提升企业市场竞争力的重要手段,越来越受到企业管理者的重视。由于供应链所处的环境并非持续稳定的,经常会遇到各种各样的突发状况,如果不能及时处理,往往会给供应链系统带来巨大的损失。供应链应急协调作为供应链管理的重要内容之一,对于应对供应链中突发事件,改善供应链系统性能具有实际意义。本文将多Agent技术引入到供应
短文本通常指文本长度小于160个字符,一般以手机短信、网页评论、网络聊天信息等形式存在的文本。短文本的热点话题识别问题是短文本应用领域必须解决的具有挑战性的基础问题