基于树形LSTM的跨语言时态标注

来源 :厦门大学 | 被引量 : 0次 | 上传用户:assofour
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在日益全球化的今天,不同国家不同文化背景的人交流愈来愈频繁。汉英机器翻译一直以来都是一个热门的研究方向。随着近几年深度学习的急速发展,神经网络机器翻译相比于传统的机器翻译方法而言取得了巨大的突破,然而距离高标准“信达雅”的要求还有较大的距离。机器翻译的时态处理问题正是目前还未得到完全解决的问题之一。本文的第一个工作旨在解决汉英机器翻译过程中的时态处理问题。通过结合前人所做的工作,本文提出基于树形LSTM的时态标注算法。树形LSTM是一种图神经网络,其对标准的LSTM进行改进,使得树形LSTM能够接受树结构的数据作为输入。本文使用树形LSTM做时态标注,结合词向量与时态信息特征,人工标注了 200个宾州树库文件作为实验数据。实验表明,基于树形LSTM的时态标注算法较前人的研究成果有一定的提升,这说明本文的方法具有一定的可行性。本文的第二个工作构建了 WordNet到HowNet的语义映射。HowNet是最具代表性的词汇知识库之一,其涵盖了丰富的语义知识。近年来,越来越多的自然语言处理领域学者致力于研究如何将HowNet中的语义知识融入到模型中。本文提出了从WordNet到HowNet的语义映射算法,使得更多WordNet英文单词能用HowNet中定义的义原和DEF表示,同时扩充HowNet的英文词汇。
其他文献
本文以我国大力实施“一带一路”倡议为研究背景,基于我国跨国企业面临的融资约束现状,旨在探讨“一带一路”沿线国家的金融发展水平、金融开放水平以及与我国的制度距离对于我国对外直接投资规模的影响。在了解我国对“一带一路”沿线国家的投资现状的基础之上,从金融发展和金融开放水平两个维度出发,分析了东道国金融市场影响我国对外直接投资的作用机制,考虑到“一带一路”沿线国家数量多、制度差异大,因此将制度环境也作为
学位
高超声速飞行器是航空航天领域中商用和军事应用重要的战略发展方向之一,随着马赫数和巡航时间的大幅增加,飞行器外表面以及主动力装置内表面所面临的热负荷问题将更加严峻,因此高效的热防护系统是保证关键部位承受极端温度条件必不可少的关键手段。其中,发汗冷却(Transpiration cooling)具有主动可控、冷却液消耗少等优点,被认为是下一代高超声速飞行器最有效的主动热防护技术。其原理主要是冷却液渗透
学位
Cu纳米金属颗粒烧结体具有优良的导电、散热性能,是目前IC产业重点关注的电热传输材料,尤其适用于柔性电路制造以及大功率半导体器件的封装互连。然而Cu纳米金属颗粒在空气气氛下烧结时容易氧化失效,使得其烧结成形工艺需要在高真空或还原性气氛下进行,严重地制约了其规模化应用。本文通过Cu纳米金属颗粒表面包覆Ag膜,合成出具有高氧化抗性与低温烧结性能的Cu@Ag核壳纳米金属颗粒,探索了颗粒在空气与真空条件下
学位
三七的市场需求因其优良的药食两用特性迅速扩大,而产地的限制导致三七价格不断飙升,同时也导致了市场上层出不穷的三七掺假现象。广泛存在的掺假现象严重破坏三七市场秩序。本文基于核磁共振技术(NMR),并结合模式识别方法,完成对三七的快速掺假鉴别与产地溯源分析。本研究第一部分利用低场核磁共振技术(LF-NMR)采集掺有川木通(CCA)的三七粉(P.notoginseng)的弛豫谱图。发现低场核磁共振参数(
学位
在分析泉州市沿海地区地质背景和水文地质条件的基础上,对研究区进行水文地质单元划分。依据381组浅层地下水化学数据,采用数理统计方法,首次建立了研究区不同水文地质分区地下水锰环境背景值范围。锰环境背景值在空间分布上的差异主要受区域地层岩性中矿物成分锰含量和地下水径流途径长短影响。在锰高含量背景区晋江流域,结合锰环境背景值对地下水进行质量评价,优质水占比83.4%,天然劣质水占比8.3%,劣变水占比8
期刊
参数估计方法在许多研究工作和实际中都有着广泛的应用。传统算法在解决参数估计问题时一般从信号的子空间或者其他变换域上进行特征提取,而本文基于神经网络提出一种以简单直接的思路解决参数估计问题的算法,并应用于不同类型的信号参数估计任务上。本文提出的网络算法使用单样本训练方式,不需要给网络提供理想信号作为标签数据。算法设计的网络框架类似自编码机结构,不过区别于典型的自编码机网络结构,本文将解码子网络替换为
学位
输尿管软镜碎石术是一种有效地治疗肾结石的微创手术。肾脏以及肾盂肾盏的解剖结构会极大地影响手术的清石率。精准的解剖结构参数测量需要基于计算机断层扫描尿路造影成像(Computed Tomography Urography,CTU)的肾脏的三维分割与重建。随着大量医学影像数据的增加以及高性能计算设备的出现,研究人员提出深度全卷积神经网络并对其不断地优化。它已经在图像分割、目标检测与识别等任务中取得了令
学位
随着信息时代的发展,我们可能收集到存在的数据集可能存在异质性和高维度等特点。当数据来自于一个异质群体时,对整个数据集拟合一个单一的模型通常是不充分的,需要对数据中的子群体进行识别,对每个子群体拟合一个模型。有限混合回归模型常被用于解决该类问题。在高维情况下,我们通常需要通过变量选择对数据进行降维,而不同子群体的回归模型可能需要不同的预测变量子集来解释响应变量。因此相比于单一的回归模型,有限混合回归
学位
货币国际化近年来被主要国家一致视为国家竞争战略的重要组成部分,中国共产党十九届五次全会也提出:稳慎推进人民币国际化。在人民币即将成为国际货币的历史趋势下,货币国际化成为国际金融领域的研究热点。四个研究方向中,货币国际化成本收益分析是理论和政策研究无法绕开的一个问题,为人民币国际化决策提供了重要的借鉴和参考。但相关研究集中在定性分析领域,仅限于探讨货币国际化收益与成本的种类,无法为人民币国际化决策提
学位
挠曲电效应对微纳米器件的力电耦合性能具有重要影响,因此,提高其在传感器、致动器和俘能器中的作用是目前重要的研究方向。本文以功能梯度挠曲电-压电材料为研究对象,主要分析不同电学边界条件下功能梯度挠曲电-压电梁结构的力电耦合性能。利用变分原理和线性压电弹性理论,推导并获得功能梯度挠曲电-压电材料悬臂梁模型的本构方程、控制方程和边界条件,并对功能梯度纳米悬臂梁结构进行数值分析,讨论挠曲电性、压电性、功能
学位