基于依存关系的越南语语义角色标注研究

来源 :昆明理工大学 | 被引量 : 0次 | 上传用户:tianshiye45
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语义分析一直是自然语言处理研究领域的重要目标之一,在目前深层语义分析很难实现的情况下,浅层语义分析的重要性不言而喻。语义角色标注作为浅层语义分析的一种常用表达方式,其任务是找出句子谓词的各个语义参数,并把它们以语义角色的形式标注出来。通过语义角色标注,能够指明某一句子所描述事件的施事者、受事者、发生的时间等语义信息。本文研究了基于依存关系的越南语语义角色标注,第一阶段探讨并解决了语料的质量问题,第二、三阶段分别采用两种方法完成标注工作。本文所实现的研究成果如下:(1)提出规则与树库转化相结合的越南语依存树库错误检测方法。针对现有越南语依存树库错误较多质量不高无法作为语义角色标注的实验语料这一问题,提出一种规则与树库转化相结合的越南语依存树库错误检测方法。该方法充分结合越南语的语言特点和语法特征,利用遍历算法构建规则库,基于Xia的转化算法将依存树转化为短语树,依据其是否能够转化成功以及短语类型对比是否一致,将越南语依存树库中存在的错误检测出来,并对检测出来的错误进行修改校对。实验结果表明,所提方法可以大大提高越南语依存树库的质量,从而有效解决了基于依存关系的越南语语义角色标注的实验语料问题。(2)提出融合多特征解决越南语语义角色标注的有效方法。针对目前基于依存关系的越南语语义角色标注研究较少这一问题,在上一阶段提供的高质量语料这一前提下,提出一种融合多特征解决越南语语义角色标注的有效方法。该方法将依存关系作为标注的基本单元,充分结合越南语的语言特点和语法特征,利用Xue剪枝算法进行预处理,采用贪心策略算法选取丰富有效的特征,基于最大熵方法训练模型,最终分别基于两种语料库进行实验,并设置多组对比实验从不同角度对影响系统性能的因素进行了对比分析。实验结果表明,所提方法可以有效解决基于依存关系的越南语语义角色标注这一问题。(3)提出基于Bi LSTM-CRF混合模型解决越南语语义角色标注的混合方法。针对现有传统机器学习方法存在的局限性问题,鉴于深度学习技术能够自动学习和构建所需要的各种特征,提出一种基于Bi LSTM-CRF混合模型解决越南语语义角色标注的混合方法。该方法将深度学习技术与传统机器学习方法相结合,将神经网络模型与线性模型相结合,将依存关系作为标注的基本单元,利用词向量工具word2vec并基于skip-gram模型将文本转换为词向量序列,通过BiLSTM自动提取文本的上下文语义特征,利用sigmoid激活函数和CRF训练模型,最终实现语义角色标注。实验结果表明,所提方法能更好地自动捕获与依存关系有关的各种语义特征,比其他方法能更好地解决基于依存关系的越南语语义角色标注这一问题。
其他文献
IP地址查找(简称IP查找)是TCP/IP网络中路由器、交换机等设备转发数据包过程中的一项核心技术。随着互联网的日益普及,网络规模持续增大,转发信息表需维护的表项也越来越多,
随着云存储技术的飞速发展以及数据的海量增长,越来越多的人将数据存储在云服务器。然而,尽管云存储带来诸多好处,由于宕机等事故的发生,存储在云服务器的数据的完整性也引起
容迟网络(Delay Tolerant Network,DTN)是一种间歇性连接的无线网络。在这类网络中,结点分布稀疏,状态很不稳定,网络拓扑变化频繁。网络的不稳定性会导致数据包传输的延迟和
在这个日新月异的社会中,科技的发展可谓是一日千里,越来越多的电子设备进入了我们的日常生活,例如空调、台式电脑等不常移动的家电和手机、平板电脑等移动设备。随之而来的
反射阵列超表面在无线远程通信系统中有着重要的应用,由于它们的增益很高、波束宽度很窄、结构很简单。本文提出了一种在X波段工作的反射式波束聚焦表面阵列结构与波束偏转表
镉是污染农田土壤中最为广泛存在的重金属元素,土壤镉污染对地球生态系统、农业生产及人类健康有着不容忽视的威胁,水稻作为镉富集能力较强的大宗谷类作物,如何降低其对镉的积累已成为当前国内外科研工作者共同关注的重大问题。本论文采用盆栽试验,选取蚯蚓粪作为有机质来源,研究淹水灌溉及湿润灌溉两种水分管理条件下蚓粪有机质对镉污染土壤环境中镉生物有效性及水稻积累镉的影响,并在此基础上进一步开展蚓粪有机质降低水稻镉
互联网是现代人们生活中必不可或缺的一部分。但现有网络体系架构很难满足各种新兴应用和技术的部署要求,网络僵化现象越发明显。网络虚拟化是解决网络僵化的一种重要手段,通
荧光分子断层成像(Fluorescence Molecular Tomography,FMT)是一种光学成像的新技术,可以从分子层面对病灶进行监测观察,为疾病的诊断提供帮助。根据动物体表产生荧光分布,使
管道结构作为五大运输方式之一,广泛应用于土木工程行业。管道在使用期间常常因为外力破坏、老化腐蚀、环境作用等影响因素而发生破坏,造成环境污染和经济损失,因此对于管道的损伤检测尤为重要,超声导波检测技术凭借其快速、高效、安全等特点,在管道结构无损检测领域中具有广阔的应用前景。本文利用超声导波探测技术,对直管段和弯管段结构中缺陷进行损伤定位以及其损伤程度的判断。(1)本文基于空心柱面导波理论,介绍导波相
全球能源危机对人类的生存和发展构成了威胁,使研究人员更倾向于开发和利用可再生资源,而温差发电因为具有无噪音、体积小、质量轻等优点,被认为是二十一世纪最有前景的新能源发展技术,但其输出功率过低、传热效果较差仍是很大的问题。为解决上述问题本文设计了微热管阵列集热型温差发电装置。本文先对系统的工作原理进行简单的介绍,为微热管阵列的材料选择以及整体结构设计仿真提供理论支持,然后对系统整体结构进行设计,选择