基于深度学习的汉英时态翻译研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:zty85633278
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在日益全球化的今天,机器翻译成为了日常生活中不可或缺的工具。中美两国作为两个世界大国,文化交流甚是频繁,汉英机器翻译的需求因此变得越来越大。随着近几年深度学习的急速发展,神经网络机器翻译相比于传统的机器翻译而言取得了巨大的突破。然而,机器翻译的效果尽管有了极大的提升,能够满足人的基本需求,但对于高要求的翻译任务来说,就目前的机器翻译来说还是远远不够的。其中,机器翻译的时态问题正是目前还未得到完全解决的问题。本文旨在解决汉英机器翻译过程中的时态处理问题。通过结合前人所做的工作,本文提出基于深度学习的树形时态标注算法。时态标注算法建立在马尔科夫树标注模型上。马尔科夫树标注模型是一种可以解决层次性问题的通用机器学习方法。语言具有层次性,从层次角度探索语言本身的含义可以获得更多的信息。本文使用深度信念网络做特征提取器,利用事先构造好的自动标注算法从平行语料库中获得标注数据。标注数据为树形结构,为了得到可供网络使用的数据,本文采用人工规则对标注数据进行编码。网络训练完成后,通过马尔科夫树标注模型对中文句子转换而成的不完全时态树进行时态标注。实验表明,基于深度信念网络的树形时态标注算法较前人的研究成果有一定的提升。这说明本文提出的方法具有一定的可行性,能够在一定程度上缓解汉英机器翻译过程中的时态问题。为了验证时态标注算法的效果,本文将时态标注算法与汉英无时态机器翻译系统相结合,得到附有时态处理模块的汉英机器翻译系统。本文利用去时态操作对原始英文数据进行处理,消除掉英文数据中的时态信息,并结合与之对应的中文数据使用Transformer 模型构建出无时态翻译系统。在翻译过程中,中文句子通过无时态翻译系统得到无时态英文句子及翻译注意力。本文利用翻译注意力构造出中英文的对齐关系,并使用对齐关系作桥梁,通过时态标注算法从中文句子中获得的时态信息对英文句子的时态进行修改。实验表明,通过结合时态标注算法的机器翻译在翻译过程中能够准确对时态进行处理,并对翻译结果有一定的改善。
其他文献
陕西印机公司开发生产出了高速、高效、高精度的GFH1050干湿法复合机。它既可实现塑/塑干法复合,又可以实现纸/塑的湿法复合及金银卡纸的复合上色,还可以进行单色印刷。
研究了基于基点工时法的塑料模具价格组成,并开发了计算机辅助报价系统,采用交互输入和自动计算相结合的方法,可迅速算出模具价格,进行快速报价.
介绍在IE-CAM系统中开发的基于特征设计的孔建模方法及在计算机辅助工艺规划中提出的工艺配置优先决策条件和刀具自动检索功能实现的工序优化配置,以实现CAPP的高智能化方法。还介绍了通
<正> 轴用圆头封闭键槽常用键槽铣刀加工,主要难点是键槽对称中心线对其所在轴颈中心线的对称度不易保证。为此本文对这一问题作探讨。
本文依据北京实际情况,提出了地下水污染风险评价指标体系。以灾害风险理论为基础,提出了地下水污染风险评价方法,对北京平原区浅层地下水污染风险进行了分区评价。评价认为:北京
提出将OMRON C200H可编程控制器用于RGR20型滚揉机,给出了一种用二极管扩展输入口的方法.结果表明,由于采用可编程控制器作为控制系统的核心,该设备在具有高可靠性的同时,也
习近平总书记提出:“努力让人民群众在每一个司法案件中都能感受到公平正义。”法院是社会正义的最后一道防线,而法官则就是这道防线的守门人,是社会正义的最高守护神。法官是国家司法制度的主要承担者,国家法律的实际执行者,其历史使命是解决各种社会矛盾,维护社会正义和公平,也是全面促进法治的重要力量。为了实现司法公正,落实司法责任制下的法官职业保障制度,加强法官职业保障制度的建设尤为重要。但从目前情况来看,我
通过对空心楼盖与普通混凝土结构的经济技术进行比较,指出了空心楼盖结构形式的优越性。根据某电子信息研发中心工程实际运用经验,浅析了GBF薄壁方箱混凝土空心楼盖施工技术,重
为解决片料压制效率低、产品质量不稳定的难题,设计了采用凸轮控制的新型模具结构,并对其拉深过程进行了分析.同时,也对本模具材料的选定作了说明.