基于回复式神经网络的机器翻译技术研究及应用

来源 :电子科技大学 | 被引量 : 2次 | 上传用户:yr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器翻译是指利用计算机将源语言语句转换成目标语言语句的过程,机器翻译突破不同语言之间沟通交流障碍,应用广泛且需求量大,是自然语言处理领域中的一个重要应用方向。回复式神经网络是一种既包含前馈通路又包含反馈通路的网络,其前馈通路相似于传统前馈神经网络模型,反馈通路可将某一些神经元的输出在之后时刻反送到自身作为新时刻的输入。这种特殊结构使得网络能够较好地捕获时序性信息,针对机器翻译技术中无法很好地捕获上下文信息的缺陷,提升传统机器翻译效果。但是基于回复式神经网络的机器翻译技术仍然存在诸多不足,包括长句翻译缺陷、可读性缺陷和漏译缺陷等。本文基于实际应用数据特性,设计数据处理方法实现由原始数据到机器翻译模型输入数据的转换;针对现阶段基于回复式神经网络的机器翻译技术中存在的缺陷,提出新的机器翻译模型,提升机器翻译效果。主要工作如下:(1)分析应用数据的形式和数据中存在的诸多不足,提出基于语言模型和语句相似度的数据处理方法。该方法包含对原始应用数据的处理、清洗和筛选,最终构建得到较高质量的用于机器翻译模型训练学习的数据集。(2)分析现有基于回复式神经网络的机器翻译技术存在的长句翻译缺陷、可读性缺陷和漏译缺陷,提出基于分块原理的机器翻译模型,提升机器翻译效果;同时提出基于语言模型的Beam Search算法,结合长度惩罚策略,测试应用阶段辅助机器翻译模型生成最终翻译结果。(3)从数据处理方法和机器翻译技术两方面分别展开实验对比,评估基于语言模型和语句相似度的数据处理方法以及基于分块原理的机器翻译模型的有效性。对比实验结果表明,基于语言模型和语句相似度的数据处理方法有效保证数据质量,间接提升机器翻译模型算法表现;基于分块原理的机器翻译模型改进传统基于回复式神经网络的机器翻译模型,翻译效果相较于Encoder-Decoder模型等有所提升。
其他文献
从生产实际中中小批量多品种加工的要求出发,提出了专机快速换刀的概念,介绍了几种实用机构的适用条件,并进一步提出了快速换切镗铣头通用化系列化的设想。
目的:观察紫杉醇联合顺铂治疗食管癌的疗效及安全性。方法近2年治疗的30例晚期食管癌患者,KPS评分≥60分,预计生存期〉3个月,血常规、肝肾功能正常,心电图正常,采用紫杉醇加顺铂全
目的:比较南京市居家与机构养老老年人膳食营养素摄入特点。方法:随机选择南京市181名60岁以上居家养老与机构养老老年人作为被调查对象,采用24h膳食回顾法对其连续3d的食物摄
目的探究中西医结合治疗骨折后膝关节粘连性僵硬的疗效。方法将78例确诊为骨折后膝关节粘连性僵硬的患者纳入研究并进行随机分组,对照组(B组)40例,观察组(A组)38例,B组采用西药镇
前言众所周知,纺织机械的磨损是十分严重的,而且这些磨损件大多是承受脉动冲击载荷而导致零件磨损失效。如多相连杆式脉动无级变速器中的超越离合器,刚性剑杆织机的共轭凸轮
超临界二氧化碳(S-CO2)布雷顿循环发电技术被认为是可以替代蒸汽朗肯循环发电的新型发电技术。本文利用热力计算方法对660 MW级S-CO2燃煤锅炉进行了概念设计,确定了各受热面
为贯彻预算管理制度改革,人民银行以财务转型为抓手,通过实施矩阵式管理、建立定额标准体系、开展绩效评价等工作,着力完善全过程预算管理。但当前基层行仍存在管理粗放、意
负债经营已被现代企业作为企业筹集资金进行生产经营的一种重要途径,但是负债也不是无限度的,它给企业带来经济效益的同时,同样存在巨大的风险.
目前,我国建筑业正处在转型升级的重要时刻。装配式建筑是一种节能环保的建造方式,具有施工周期短、对环境污染小等优点,但目前仍然存在着建筑设计标准不一致、各个环节之间