基于机器学习的交互式机器翻译方法研究

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:laozhoudehua
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着经济全球化进程的加快,翻译服务的重要性逐渐体现。从统计机器翻译到如今的神经机器翻译,机器翻译技术走过了漫长且辉煌的历史。目前基于数据驱动的神经机器翻译已经达到了不错的效果,但是在专业翻译领域以及语言资源稀缺的语种翻译任务中还是难以达到专业译员的期望。因此,开展交互式机器翻译的研究是未来的研究趋势。以往的交互式机器翻译大多是基于统计机器翻译,本文在神经机器翻译基础之上,开展了基于机器学习的交互式机器翻译方法研究,工作如下:(1)将句子相似度计算引入交互式机器翻译。为了提高交互式机器翻译领域句子相似度计算的准确性,本文提出了一种融合同义词和词向量的句子相似度计算方法。通过Skip-Gram模型训练词向量,用词向量相似度代替共现词,将语义信息引入句子相似度计算。通过构建同义词表,在计算相似度的过程中融入同义词,提高句子相似度计算的准确性。与传统算法对比,本文所提出算法的精确率与F值均有提升。(2)研究与改进互式神经机器翻译的解码方式。在基于编码器-解码器框架的神经机器翻译中,解码器部分根据上下文向量对原文进行解码翻译生成译文。从解码器端出发,通过翻译人员为解码器按照顺序提供正确的译文,相当于为解码器提供解码的约束条件。解码器根据翻译人员提供的约束条件重新进行解码翻译,生成带有部分人为干预的译文,从而实现翻译人员和机器翻译的交互,提高翻译的准确性。(3)将主动学习应用于交互式神经机器翻译。本文将机器学习领域的主动学习算法引入交互式神经机器翻译,根据交互式神经机器翻译模型的注意力机制,以及翻译领域的平行语料特点,设计了三种采样策略。通过采样策略在未标注的数据集中选取出对模型提高最为有效的句子交由翻译人员进行翻译,生成标准的原文译文对照的双语句对,使用随机梯度下降优化策略对模型进行增量训练。通过实验分析,本文设计的采样策略相对于随机采样表现更好,可以提高互式神经机器翻译的表现。(4)设计并实现一个交互式翻译系统。该系统由客户端和服务端组成,客户端与用户进行实时交互,并且承担文档导入和文档预处理等功能。服务端包括句子相似度计算模块、交互式机器翻译模块和数据库模块。系统采用前后端分离的设计理念,服务端和客户端通过HTTP协议进行通信,减少系统的耦合性,方便系统进行升级和维护。
其他文献
大规模风电机组并网会给电力系统的稳定性带来重大影响,在电力系统运行分析中,仿真模型需要与物理系统一致,其中模型参数的准确性是确保电力系统模型准确的关键所在,在风电机组测试与运行中,参数辨识是获取模型参数是一种可行方法。本文结合人工智能发展的相关研究成果,开展了双馈风机变流器控制系统的参数辨识研究,主要工作如下:首先,对双馈风机的数学模型进行了分析,并考虑风机在不同运行区下的运行特性,建立了相对应的
学位
太阳能作为一种清洁型能源具有不可替代的作用,光伏电池缺陷的存在会极大地影响其使用寿命和转换效率。基于机器视觉的光伏电池缺陷识别技术可以为光伏电池成品质量提供有效保障。然而,由于光伏电池缺陷样本采样不足、非均匀纹理背景的干扰、像素级标注难等问题,导致依赖大量高质量标注数据的深度学习技术应用于光伏电池缺陷识别时存在诸多问题。为此,本文针对光伏电池复杂背景下基于域适应的缺陷识别问题展开了研究,具体研究内
学位
近年来重大的踩踏事故时有发生,这些事故造成了严重的生命和财产损失。通过计算机仿真对人员疏散的过程进行研究,可以为场馆设计和疏散预案的制定提供指导。在人员疏散的过程中,出口附近会出现拱形效应形成拥堵,降低出口利用率,而设置导流措施可以约束行人的速度大小和方向,从而加快出口处的疏散效率,有利于更快地完成疏散。本文重点从以下几个部分进行了人员疏散中导流的仿真研究:首先,改进了社会力模型。现有的社会力模型
学位
低压电器试验是电器产品元件在低压配电系统中使用及运行的必要前提和重要检测试验手段。但目前的低压电器试验多是采用电阻、电感与电容的组合模拟各种负载特性的试验,由此传统模拟负载所带来的灵活性不足以及能源浪费等缺点就无法避免。本文以交流固态负载代替传统模拟负载,以提高系统的通用性和灵活性,重点对其电流发生单元及能量回馈单元的控制策略进行研究。首先,根据低压电器使用类别及电寿命试验参数,对低压电器电寿命试
学位
交流接触器是一种广泛应用于电力控制系统中的低压开关电器,其优点是可以远距离频繁接通和分断交流主电路和大容量控制电路。针对交流接触器的初期特性参数进行电寿命的定量评估更有利于实现产品的早期筛选,对提升系统的可靠与安全性均有重要意义。考虑到接触器机电特性参数对电寿命均有着一定的影响,因此,本文提出一种基于初期机电特性参数的交流接触器电寿命定量评估方法。基于交流接触器动态特性测试系统和电寿命试验系统进行
学位
随着社会经济的高速发展,全球对能源的需求量不断提升,传统的化石能源已经不能满足社会高质量发展的需求,新能源在能源结构中的占比越来越高。双向变流器作为交流侧与直流侧的传输通道,在新能源发电中起着关键性的作用。传统的双向变流器在逆变模式下,若交流侧带三相不平衡负载,负荷端电压将不对称;在整流模式下,若直流侧串联两个额定电压相等、功率不相等的直流负载,直流中点电压将发生偏移。为此,本文设计了一种能够适应
学位
随着我国化工业的发展,危险化学品的应用范围越来越广。酸作为最被人熟知的危化品之一,在方便人们生活的同时,也隐藏着巨大的安全隐患。由于酸液的危险性质,其在生产、储存、运输、经营、使用等环节均会由于操作不当造成事故,引发经济损失。据调查,小型企业、实验室自动化控制水平较低,更易发生安全事故,因此本文研究并设计了一套小型浓酸自动配液系统。该系统使用机器代替人工配酸,不仅极大的降低了酸液使用时的安全风险,
学位
以风电为代表的清洁环保电力大规模介入互联电网,其出力不确定性给系统发电侧带来大量有功扰动,影响系统功率平衡状态,造成电网频率波动。本文研究有风电介入的负荷频率控制问题,运用模糊控制、云模型控制等不确定性智能控制技术解决风电并网带来的频率波动问题,提升电网的负荷频率控制品质,进而提高风电的渗透率与消纳水平。首先,在对负荷频率控制系统各部分的数学模型进行研究的基础上,建立各模块的低阶线性化模型,建立有
学位
随着化石能源的日益减少和环境污染问题日益加剧,迫使世界各国亟需寻找可替代的能源。风能以自身清洁和资源充足的优点在新能源发电技术领域引起了人类的高度关注。然而,由于风能的随机性和不确定性,使得偏航系统频繁启停以进行迎风动作,从而给风电机组稳定运行带来挑战。本文分析了偏航系统静态误差和偏航策略误差产生的原因,以华北某风场四种类型风机为背景,从以下几个方面展开了研究。首先,论文对偏航系统工作原理及工作模
学位
高校教师党支部书记“双带头人”培育工程和高等学校课程思政建设,都是夯实为党育人、为国育才的重要抓手。文章以柳州职业技术学院基层党支部建设为例,阐述基于高校教师党支部书记“双带头人”培育工程的“党建+课程思政”改革与实践,提出“‘一室’打头阵、‘二化’控质量、‘三全’促成效、‘四情’润人心”的“党建+课程思政”实施路径,以推动党建工作和业务工作双融合、双促进,落实落细立德树人根本任务。
期刊