统计机器翻译译文错误检测与校正方法研究

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:aspoptyy4
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,基于统计的机器翻译方法得到广泛的应用,如软件本地化、翻译后编辑等领域。然而,受限于双语语料的规模和质量,当前的统计机器翻译系统仍然无法提供等同于人类的翻译质量,因此,在实际应用中,统计机器翻译系统一般作为辅助手段协助翻译后编辑人员工作,以提高工作效率。  对译文中的翻译错误准确定位,且在一定条件下对翻译错误进行自校正,是提高后编辑人员工作效率的一个重要途径。针对该问题,本文提出基于监督学习的翻译错误自动检测和基于复述的错误自校正策略,用以改善统计机器翻译质量。  课题主要针对机器翻译译文中出现的集外词与非集外词进行分类研究。对于集外词而言,可以直接从翻译结果中识别,然后用其含有翻译候选的复述(paraphrases)进行替换,从而达到显著降低集外词的概率。对于非集外词而言,将译文错误检测问题作为一个监督分类问题,即给定一组候选译文,从标注分类类别的数据集中抽取多个置信度特征,采用监督学习方法训练分类模型,然后将测试集候选译文中的单词分为“正确”与“错误”两类。最后,通过将错误的译文单词或短语映射到源语言端,并对该源语言词或短语进行复述表示,使得机器翻译系统的解码器在最优翻译候选选择时,可以搜索到更符合上下文环境的翻译候选,从而提高翻译质量,降低翻译错误率。  在基于Moses的统计机器翻译基线系统上,本文以NIST2008作为开发集,NIST2005作为测试集进行了错误分类和错误自校正实验。实验结果表明,利用多特征组合方法可以显著降低分类错误率,提高译文错误预测能力;在利用复述改善机器翻译质量实验中,相对于基线系统,在NIST2008和NIST2005测试集上的实验表明,本文所提方法可提高0.57个BLEU点,有效提高了系统的翻译性能。
其他文献
随着工业化的快速发展,工业过程变得越来越复杂。常规的PID控制已经难以适应现代化的控制要求。内模控制(IMC)以其简便的设计方法,良好的控制效果,独特的鲁棒性以及预测能力
目前,柴油机燃油系统故障诊断理论和方法已成为研究的热门课题。作为往复式机械的典型代表,柴油机燃油系统故障呈现出复杂性和多样性的特点,因而应用传统的故障诊断理论和方
超声波在流体中传播时,会携带其流速信息,超声波流量计就是通过提取这些信息来测量流量的。本文开发了一套用于巡检高炉冷却循环水流量的超声波测量装置,以改善目前其测量成本高、维护不便、备件多、对工人技术水平要求高的现状。论文从高炉冷却水的实际情况出发,系统确定了采用时差法测量原理,探头采取U法安装,以32位ARM Cortex-M3系列单片机STM32F103RE作为处理器,达到1%测量精度的整体方案。
随着城市化建设进程的加快以及经济社会的发展,城镇化的进度也在新建设体系中逐步加快,人群聚集的情况也会越来越多,例如一些娱乐活动、展览活动、体育赛事、庆祝等大规模活动中
随着资源短缺和环境污染问题的不断激化,可再生能源的利用受到广泛的关注。太阳能因其用不尽,能量大,无污染而备受瞩目,这些都促进了光伏发电的大力发展。论文以光伏发电(PV)系统为研究对象,开展了光伏发电系统的最大功率跟踪(MPPT)的智能方法的研究,旨在提高光伏发电系统的发电效率。论文首先根据光伏电池的结构分析了其工作原理,为搭建了光伏组件模型奠定了基础。然后对光伏电池模型进行仿真,结果得出了光伏电池
随着人们对海洋的开发日益深入,现阶段人们对深海自主水下机器人(Autonomous Underwater Vehicle,AUV)的使用提出了更高的要求,希望AUV能够完成例如海底地形跟踪,海底矿产资
为了测试异步电机的堵转、空载和负载等机械特性,本文研究了异步电机测试控制系统。在电机教学过程中,为培养学生的动手操作能力,该系统是不可缺少的一个环节。本文简要介绍了电机测试装置的发展现状,并设计分析了能量回馈型异步电机测试控制系统的整体结构和功能。传统的电机测试实验以能耗装置来做电动机的负载,这种方法不仅造成能量的浪费,而且负载调节也极不方便。本文采用可控整流/回馈单元模式加载具有非常良好的加载特
电石作为重要的工业化合原料具有广泛的用途和市场前景,电石炉是生产电石的主要设备。针对电石炉是一个具有多变量、强耦合和时变等特点的被控对象,采用常规的PID控制算法难
电动机是电力传动机构的核心,是工业控制系统中非常重要的组成部分。永磁同步电动机具有结构简单、高效率、高功率密度等特点,结合先进的控制算法和处理芯片,永磁同步电动机伺服系统在许多领域得到广泛应用。首先,本文分析了永磁同步电动机的结构及特点,研究了永磁同步电动机的磁路参数,为建立永磁同步电动机的数学模型及进一步的控制方法打好了基础。在永磁同步电动机数学模型的基础上,结合矢量控制算法,介绍了矢量控制系统
工业控制系统在设计之初,主要考虑的是生产的可靠性和稳定性,并未将信息安全作为主要的设计指标。但随着信息化与工业化的深度融合以及以太网技术在工控系统中的应用,在拓展