融合翻译知识的汉越神经机器翻译研究与实现

来源 :昆明理工大学 | 被引量 : 2次 | 上传用户：flyballball

【摘要】

：

越南位于中南半岛、毗邻我国广西、云南两省,在政治、经济等方面都是我国的重要合作伙伴。在“一带一路”战略下,我国与越南的合作空间巨大,两国当前越来越紧密的经济、文化

【作者】

：

王卓

【出处】

：

昆明理工大学

【发表日期】

：

2018年01期

【关键词】

：

神经机器翻译汉语-越南语双语词对齐翻译知识融合

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

越南位于中南半岛、毗邻我国广西、云南两省,在政治、经济等方面都是我国的重要合作伙伴。在“一带一路”战略下,我国与越南的合作空间巨大,两国当前越来越紧密的经济、文化交流对于两国语言的机器翻译技术提出了越来越迫切的需求。然而,已有的机器翻译技术对于平行语料的需求与语料的稀缺性成为了阻碍这一技术发展的主要矛盾。近年来神经机器翻译技术已经在多种语言对上取得了超越统计机器翻译的性能,并且在译文流畅度等方面取得了空前的成功,但这一技术同样需要大量的平行语料作为训练数据。同时,在过去的统计机器翻译研究过程中的成果也不可忽视。因此,研究如何将统计机器翻译中的翻译知识融合到神经机器翻译框架中成为了当前的研究热点。基于此,本文将上下文约束和语言特性应用于词对齐建模,研究基于双向LSTM的词对齐模型,并进一步研究如何将翻译知识融合到神经机器翻译模型中,主要完成了以下研究工作:(1)基于双向LSTM和语言特性融合的汉越词对齐方法词对齐是多种机器翻译模型(如短语翻译模型、句法翻译模型)的基础,是短语对齐、句法树对齐的依据,是统计机器翻译方法中的重要组成部分。本文使用双向LSTM对词对齐进行建模,引入对齐位置的上下文信息;在此基础上融合汉语-越南语语言差异,基于语言特性约束词对齐关系,通过监督学习调整模型参数,从而获得性能更优的汉越自动词对齐方法。(2)融合词汇翻译概率的汉越神经机器翻译方法神经机器翻译方法的参数解释性差,很难融合词对齐、词典等外部翻译知识;同时,虽然其内部的注意力机制在某种程度上可以反映源语言词语和目标语言词语的对应关系,但这种关系并不具有显式约束。本文提出了一种在神经机器翻译中融合词汇翻译概率的方法。首先使用一个记忆神经网络保存词对齐信息,完成离散特征到连续特征的转换。然后在神经机器翻译的解码阶段,根据目标语言词语及其上下文信息计算目标语言词语与每个源语言词语的对齐概率。最后将这个对齐概率与注意力机制进行融合,从而完成解码阶段目标语言词语的选择。(3)融合翻译知识的汉越神经机器翻译系统该系统包括机器翻译模块、web后端服务模块、web前端服务模块。其中翻译模型的实现基于Google的代码并做了大量改进,主要包括对传统注意力机制的修改,将词汇翻译概率融合到神经机器翻译框架中。该系统对于将翻译知识与神经机器翻译融合的研究具有重要的支撑作用。

其他文献

口腔颌面锥形束CT在临床应用中的辐射剂量研究

目的:(1)研究口腔颌面锥形束CT在不同视图域扫描后颌面部非目标部位敏感器官及组织接受的辐射剂量。(2)计算NewTomVGi 口腔颌面锥形束 CT(Cone-beam computerized tomography

学位

口腔颌面锥形束CT非目标部位敏感器官视图域辐射剂量

压气机转子叶片激振力与振动响应研究

压气机转子叶片在发动机上工作时后会受到非定常激振力的作用而导致受迫振动。本文以压气机第一级转子叶片为研究对象,首先验证了非定常与定常数值模拟方法,接着计算不同工况

学位

压气机转子叶片激振力振动响应流固耦合

DP980双相钢焊管自阻加热组织性能演变规律及弯管校形研究

为了节能减排应对能源危机,汽车工业生产和航空航天制造领域不断加快轻量化进程,高强钢、铝合金、镁合金和钛合金等轻质材料得以快速开发和应用。双相钢具有较高成形性能和强

学位

DP980双相钢ERW焊管自阻加热回弹组织演变热校形

河南省S家居有限公司战略成本管理研究

战略成本管理,是在综合考虑企业的内外部的环境状况下,以提高企业竞争地位为目的进行的成本管理。该理论是二十世纪末管理会计理论与战略管理理论相结合的产物,也成为了今后一个时期企业管理理论的发展方向,在企业的实际应用中有着很强的指导意义。建材行业长期的粗放式发展,已经对未来的发展形成了一定的约束。在淘汰落后产能,迈向转型和创新的过程中,数量不少的家居制造企业由于经营和生产的原因,陆续退出了这个行业。20

学位

成本管理战略定位竞争优势

矿用高压电缆局部放电测量传感器的研究及应用

监测矿用高压电缆中局部放电信号对于在线评估电缆寿命和分析绝缘状况意义重大。对比了电缆绝缘监测的常用方法,其中采用高频电流传感器监测局部放电是一种有效手段。运用无

期刊

高频电流传感器幅频响应局部放电矿用电缆

“只问耕耘不问收获”——介绍中国当代清史、民族史和满学专家王钟翰教授

<正> 先生姓王名钟翰,以字行,生于1913年,湖南省东安县伍家桥乡人。童年就读私塾,聪敏好学,为老师、家长和乡贤所称许。十五岁时,离乡远游,考入长沙雅礼中学。学习期间,英语

期刊

民族史呼尔哈王钟翰

特斯拉“低价”策略意欲何为？

1月22日，明星电动跑车特斯拉在官网上公布其MODELS系产品在中国正式上市，其中ModelS85售价仅为73.4万元，ModelSP85售价为85.25万元。与其他豪华车品牌在中国远高出国外定价的策

报纸

麦秸还田对土壤氮素转化及玉米产量的影响

作物秸秆是地球上最丰富、可再生的生物质资源,秸秆还田是减少秸秆焚烧,保护环境,提高水体、土壤环境重要措施。通过田间试验探究不同还田深度及施肥条件下小麦秸秆腐解规律

学位

小麦秸秆腐解土壤微生物氮素循环玉米产量土壤呼吸

特斯拉入华的“最后一步”

特斯拉距离实现在华正式销售的目标仅剩下“最后一公里”——商标问题。$$　　　　11月6日，特斯拉（TSLA.NASQ）在发布其三季度财报后举行了电话会议。CEO马斯克在回答分析师关于

报纸

循症护理在慢性阻塞性肺疾病康复期呼吸机功能锻炼中的应用

<正>循症护理是20世纪90年代受循证医学思想影响而产生的护理观念,又称为"实证护理",即护理人员在护理实践中运用现有最新最佳的科学证据对患者实施护理[1]。近几年来,循症护

期刊

循症护理慢性阻塞性肺疾病呼吸机功能锻炼

融合翻译知识的汉越神经机器翻译研究与实现

与本文相关的学术论文