【摘 要】
:
句法功能即表示一种语言中所有组成成分之间的关系。所谓功能成分,通常是指主语、谓语、宾语、状语等。除了短语结构分析和依存句法分析之外,功能成分分析是对句子分析的另一
论文部分内容阅读
句法功能即表示一种语言中所有组成成分之间的关系。所谓功能成分,通常是指主语、谓语、宾语、状语等。除了短语结构分析和依存句法分析之外,功能成分分析是对句子分析的另一个研究内容。短语结构分析和依存句法分析存在各自的优缺点,即短语结构分析清楚地体现了句子中所有短语之间的层次树结构,而缺少各短语之间的关系分析;依存句法分析虽然对句子短语之间的关系进行了分析和标记,但是又缺少句子内部的层次结构分析。但是,对句子的句法功能成分分析能够很好地结合两者的分析特点,既给出句子内部所有组成成分的层次关系,又对各成分之间的关系进行分析。而且,句子的功能成分信息在自然语言处理领域的很多任务中会有很大的积极作用。比如,在机器翻译任务上,可以将功能成分信息作用到词对齐的过程中;在语义分析任务中,可以将功能成分信息作为分析过程中的一种条件限制。然而关于句子的功能成分分析,至今在国内外还没有专门的研究。据此,我们提出了构建汉语句子的功能成分树库标注体系以及对汉语句子进行功能成分分析的方法研究。本文主要研究内容和相应的成果详细总结如下:(1)根据语言学上对句子中各种功能成分的相关定义,我们详细地说明了在功能成分树库中功能成分的标注准则,最终构建了一个关于汉语句子的功能成分树库标注体系。(2)以上述树库标注体系为准,我们对现有功能成分语料库进行了错误修正以及对语料库进行了适当的扩充。目前语料库中的训练集有23758句汉语句子,经人工校正的测试集有1000句。(3)在功能成分树库的基础上,我们进行了汉语句子功能成分分析的方法研究。通过对比基于条件随机场、基于深度学习、基于转移的功能成分分析方法,最终发现基于转移的分析方法训练的模型具有更好的性能,不仅分析精度较高,而且输出结果是具有层次结构以及句法信息、功能信息的分析树。(4)最后,我们对汉语功能成分树库进行了相关功能成分之间的搭配规律进行了数据统计和总结分析,这部分结果一方面印证了前文的部分工作结果,另一方面将有助于功能成分分析的进一步研究。
其他文献
在计算机视觉的领域中,视频目标的跟踪有着重要的研究意义,视频目标跟踪的主要工作是在一段视频序列中寻找出与指定目标最相似的内容以检测、识别、提取和跟踪,通过分析获得
医用B超以超声波为载波,通过幅度调制与解调机制完成对人体生理组织的探测。传统B超由于电子技术水平的限制普遍采用模拟电子技术实现,但由于模拟线路自身干扰大、信号处理精
计算机网络的高速发展给网络管理带来了重大挑战。但是SNMP协议在网络配置,传输效率,安全性,告警管理等方面仍然存在根本性的缺点。而基于XML的NETCONF协议具有强大的配置功
随着信息技术的发展,资产密集型企业的设备功能不断增强,构成更加复杂,自动化_、系统化程度越来越高,相应的维护与管理更加困难,从而给企业设备管理工作带来许多新的问题,严
Hadoop是目前最流行的大数据存储与计算平台,具有廉价,稳定,易扩展等特点。尽管Hadoop应用很广,Hadoop的错误与故障诊断却仍然依靠人的经验。实际上错误与故障信息就隐藏在日
水泥基材料作为主要的基本建设原材料之一,在工业、农业、交通、城市建设、水利以及海洋开发等工程建设中有着广泛的应用,在经济社会的发展中占有突出的地位。同时,也越来越显示出水泥制品在代钢代木方面的优越性。因此,水泥基材料性能的提高对于促进国民经济和保证国家建设意义重大。而水泥的微观结构对水泥的性能和性质有着巨大的影响,因此对水泥微观结构的研究在提高水泥性能方面有着极其重要的作用。随着计算机科学技术的进
从上世纪五十年代软件诞生开始,软件设计一直是软件系统开发的核心内容,好的软件设计有助于软件开发人员提高工作效率,减少不必要的开支以及保证软件的正确性。但采用何种方法来
进化算法是模仿生物自然进化过程的一种随机搜索方法,最初具有三大分支:遗传算法、进化规划和进化策略。九十年代初美国学者Koza在遗传算法的基础上提出了一种全新的结构描述
随着计算机技术和网络技术在虚拟仪器领域的不断深入,网络化已成为虚拟仪器技术发展的一个重要方向。同时复杂的测试任务对测试系统提出了新的需求,基于网络的、可配置的、分布
近年来,随着拍照设备的不断升级,存储图片所需的内存空间飞速增长,然而硬盘、U盘等存储设备的容量却增长缓慢。不断增长的图片数据量与有限的存储容量之间的矛盾给图像压缩带