介词、连词用法在短语结构句法分析中的应用研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:chongyou2026
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中文句法分析是自然语言处理领域中的一个重要课题。针对汉语本身的特点,本文将介词用法融入到句法分析结果中,使用介词用法属性对Stanford Parser进行后处理。首先,为了得到较高的介词用法自动识别结果,本文在已有的基于规则的介词用法自动标注方法的基础上,提出了基于统计的介词用法的自动标注方法,分别采用条件随机场、最大熵和支持向量机三种统计模型,以2000年2月、3月、4月《人民日报》分词与词性标注语料为实验语料,对常用介词进行了自动标注实验,实验结果表明基于统计的介词用法自动标注总体上优于基于规则的介词用法自动标注结果。其次,本文在Stanford Parser分析结果的基础上,使用由介词用法属性特征得到的边界识别结果,对已有句法分析结果进行一定的修改,从而提高中文句法分析的准确率。实验表明,融入用法属性特征的句法分析结果比之前结果有了一定的提高。最后,为了验证基于介词用法的句法分析后处理方法的适用性,本文将此方法进一步运用到了连词中,且得到了较好的实验效果。本文主要的工作包括:(1)根据“三位一体”广义虚词知识库,在对基于规则的介词用法自动标注结果进行人工校对所得到的正确语料的基础上,实现了基于统计的介词用法自动标注。(2)在介词用法自动识别、基于用法的介词短语边界识别、Stanford Parser及宾州中文树库的基础上,实现了介词用法在短语结构句法分析中的应用研究。(3)根据介词用法在短语结构句法分析中的应用研究,在连词用法自动识别、基于用法的连词短语边界识别的基础上,实现了连词用法在短语结构句法分析中的应用研究。最后,对本文的研究内容进行了总结,并根据研究结果对下一步工作做了展望,指出了下一步的研究方向。
其他文献
随着互联网和大数据技术的不断发展与应用,产生了源源不尽的数据流。数据流的产生具有无限性、连续性、动态性和实时性,因此对数据流的分析处理要求快速有效地获取结果,以便
多约束QoS组播路由问题是下一代网络发展亟须解决的一个关键问题。对其展开研究具有重要的应用价值和学术价值。多约束QoS组播路由问题被证明是一个NP难问题,所以传统的图论方
随着计算机和互联网的普及与发展,网络上各种信息资源的数量也在爆炸性的增涨。互联网用户在享受海量数据信息带来便利的同时,也必须面对如何从这庞大的信息中提取自已所需信
人工神经网络是近年来的热点研究领域,其应用领域诸多,包括:信息处理、材料学、交通、经济等,并在不断拓展。在众多的神经网络中,又以BP(BACK-PROPAGATION,简称BP)神经网络的
随着互联网及信息技术的快速发展,现代社会所面临的问题已由如何获得信息转变为了如何在迅猛增长的海量数据中找到有价值的信息。气象资料类型复杂,数据量庞大,其中蕴藏着大量的
白从20世纪60年代出现机器人以来,机器人技术已经经历了几十年的快速发展,从最初的传统工业领域向军事、医疗、服务等领域渗透。服务机器人作为机器人家族中的年轻成员,是一
随着无线技术的进步和微型传感技术的发展,无线传感器网络成为一种非常重要的信息收集和处理方式。节点定位是无线传感器网络应用中最关键的支撑技术。由于无线传感器网络往
快速的经济发展、不断升级换代的计算机软硬件以及不断提高的网络速度,互联网已经渗透到人们生活的各个领域之中,再加上物联网技术的火热,各种基于网络互连智能化的应用逐步融入
自动人脸识别技术由于其广阔的应用前景,目前已成为生物识别领域热点研究课题之一。经过近50年的发展,二维人脸识别技术已日趋成熟,但也易受姿态变化等影响。三维人脸识别的提出
并行多处理器系统的容错计算一直是研究者关注的问题,识别故障处理器节点的过程称为系统故障诊断。系统的故障诊断,主要分为两种方式,一种是电路级诊断,一种是系统级诊断。在电路