基于SEARN框架的中文句法分析技术研究

来源 :南京师范大学 | 被引量 : 0次 | 上传用户:ffyy5051
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
句法分析是自然语言处理领域中重要的基础研究问题之一,已经被广泛应用于信息抽取、问答系统、机器翻译等领域。因此,众多的学者都对句法分析任务予以高度的重视。本文针对目前中文句法分析的难点,提出了新型的中文句法分析方法。本文的研究的主要内容有以下的几个方面:1、基于统计的句法分析方法研究。近些年来,基于统计学习模型的句法分析方法研究受到了广泛关注,多种模型与算法先后被提出。从采用的学习模型和算法类型着手,本文系统地对各种主流和前沿方法进行了归纳与分类,着重对各类模型和算法的思想进行了分析和对比,并对中文句法分析的研究现状进行了综述。2、基于移进-归约决策的句法分析方法研究。基于移进-归约决策的句法方法在中文上取得了比较好的性能,但该句法分析方法仍有较大的研究价值和性能提升空间。针对目前已有的研究成果,本文实现了基于移进-归约决策的中文句法分析baseline系统,并且引入了特征组合和BeamSearch解码策略,有效地提高了该方法的句法分析性能。3、基于SEARN框架的句法分析方法研究。基于移进-归约决策的中文句法方法是将传统的基于PCFG规则驱动的方法转为基于分类器分类决策的方法,然而句法分析任务本质上是结构化预测问题,与分类问题并不等价。本文通过引入SEARN算法,弥补了基于移进-归约决策的中文句法方法的不足,提高了句法分析器的性能。本文主要创新点主要表现在:提出了基于SEARN框架的句法分析方法,该算法克服了移进-归约决策方法的固有缺陷,而且扩充了SEARN算法的应用范围,该方法不仅仅取得了良好的性能,而且具备良好的可扩充性,能够有效地集成其他自然语言处理任务。
其他文献
旋翼飞行机器人由于其垂直起降、定点悬停、低空低速飞行的飞行特性成为架空电力线路巡检的有效手段。电力杆塔作为输电线路最核心部分,对其图像数据采集的效果决定了整个巡检
云存储技术的发展使将文件存储在云端的人们的数量变得越来越大。人们将数据存储在云端的目的是为了节约存储设备的花费。那么如何保证数据在云存储中的隐私性和完整性就成了
词义归纳利用聚类技术自动从未标注语料中获取多义词的词义,从而大大提高语言工作者的工作效率。因此,词义归纳成为当今计算语言研究中一个最重要的课题。本文基于CLP2010提
光刻机系统中,工件台控制系统作为重要的子系统之一,完成工件台的控制和硅片的曝光过程控制。位于测量区的工件台需要与上下片系统、调平调焦系统进行协同工作,完成载片、卸片、
随着当今科技的进步与发展、网络规模在不断壮大,网络的这些特性(如分布性、复杂性、异构化和不合作化)越来越明显,这就加大了网络管理的难度;同时,人们提高了对网络服务质量的要
多功能一体机作为一种集打印、扫描、复印、传真等功能于一身的办公设备。因其节约成本、节省空间、提高工作效率的强大优势,迅速受到企业及家庭用户的青睐。近年来随着一体机
随着企业信息化建设的深入,山西移动同其他大型企业一样,面临来自管理支撑、技术架构和运营管理多维度的转型压力,客观上需要设计新一代企业信息架构以促进业务流程再造和业
随着信息技术的发展,网络的普及,各种各样的信息资源充斥着网络。随着微博的推广,微博的用户在以每年数以亿计的速度增长。每个用户信息包含几十条的属性,应该如何划分微博用
当今,视频监控系统越来越多地应用于日常生活中,它带来便捷的同时,也引出了海量视频流数据的存储需求。分布式存储系统能够很好的满足这一需求,而且由于故障发生的可能性,容
与应用密切相关的传感网,自提出以来就得到了学术界、工业界及军政各界的广泛关注。在早期的传感网密钥管理方案研究中,一般都假设传感器节点是低功耗的、无差异的,网络结构