【摘 要】
:
随着世界全球化进程的不断推进和自然语言处理等技术的持续革新,人类对机器翻译系统的依赖程度与日俱增。尽管机器翻译技术帮助人类缓解了不同语言间的沟通障碍,但它仍存在不足之处:译文质量难以评判。为进一步提高机器翻译系统的用户体验,帮助用户识别质量较差的机器译文,研究者们提出了机器翻译译文质量估计方法。译文质量估计是在没有人工参考译文对照的情况下对机器译文质量自动进行打分。本文提出了融合语境词向量的译文质
论文部分内容阅读
随着世界全球化进程的不断推进和自然语言处理等技术的持续革新,人类对机器翻译系统的依赖程度与日俱增。尽管机器翻译技术帮助人类缓解了不同语言间的沟通障碍,但它仍存在不足之处:译文质量难以评判。为进一步提高机器翻译系统的用户体验,帮助用户识别质量较差的机器译文,研究者们提出了机器翻译译文质量估计方法。译文质量估计是在没有人工参考译文对照的情况下对机器译文质量自动进行打分。本文提出了融合语境词向量的译文质量估计方法。“语境”在本文意为词的上下文信息和丰富的句法、语义知识,它能反映文本的流利程度,是自然语言处理任务中的重要概念。在现有基于神经网络的质量估计方法上,本文结合流利度特征进行译文质量估计。为了将译文流利度特征引入现有的神经质量估计模型,我们提出利用堆叠双向长短时记忆网络将语境词向量引入神经译文质量估计模型的方法——CUNQE。CUNQE通过网络并联的方式将语境词向量与传统的译文质量向量相融合。融合语境词向量和质量向量的译文质量估计方法综合应用了机器译文的忠实度特征和流利度特征,对机器译文质量的评估更加全面。本文在CWMT18、WMT18句子级别译文质量估计评测任务数据集上对融合ELMo、BERT语境词向量的神经译文质量估计方法的效果进行了验证与分析。实验结果表明,引入语境词向量的译文质量估计方法可显著提高译文质量估计与人工评价的相关性,并且使用BERT语境词向量融合的神经译文质量估计方法性能最优。实验分析进一步揭示了融合语境词向量的译文质量估计方法能利用译文的流利度特征提高翻译质量估计的效果,同时表明语言模型的预训练方式、语境词向量的使用方法及质量是影响神经质量估计模型性能的关键因素。
其他文献
历史文化街区以其深厚的历史底蕴和强烈的文化氛围,受到众多旅游者的广泛关注。但因为历史文化街区旅游数据源的获取和技术方法上的不足,导致现有的研究缺乏量化的行为分析支
“绿水青山就是金山银山”的重要论述把可持续发展提升到绿色发展的新高度,作为当今社会发展的重要内容,生态文明建设关系着人民福祉,关乎着民族未来,在全民的高度重视和推动
随着社会经济的发展,越来越多的隧道被开挖出来,并由此引发了隧道涌水、漏水等一系列问题。在岩溶地区由于土层浅薄、地下岩溶裂隙管道等发育,因此地下水循环系统更加复杂和
受地表地形影响,丘陵地区井工开采引起的地表移动规律与一般平原地形地表移动规律不同。针对山西大宁煤矿一零八工作面现场采矿地质条件,通过现场实测数据分析、FLAC3D数值模拟以及相似材料模拟实验手段,对丘陵地区井工开采地表移动变形特征进行研究,分析不同开采方案下铁路的移动变形情况,选取最优的开采方案达到保护铁路的目的。对大宁煤矿一零八工作面地表移动观测站实测资料整理分析,得出丘陵地区井工开采地表移动变
超疏水表面由于其独特的润湿性能在日常生活和工业生产中展示出巨大的应用前景,例如纺织品的防水、建筑外墙的自清洁、电缆的防冰和管道的流体减阻等。水珠在超疏水表面通常
近年来,我国地下空间开发呈现立体化和密集化趋势,各种地下工程近接施工变得越来越频繁。其中,邻近既有隧道的基坑开挖工程是常见的近接工程类型之一。软粘土地层深基坑开挖
在工业生产过程中,材料发生韧性断裂导致零件直接报废的现象十分常见,因此采用数值模拟方法预测材料在成形过程中的起裂位置、起裂时刻以及裂纹扩展方式至关重要。数值模拟结果的准确性依赖于所选取的材料本构模型以及韧性断裂准则。当前大多数断裂模型的研究都集中在比例加载条件下,少数适用于非比例加载条件的断裂模型也基本上是面向比例加载断裂模型的扩展。由于工业生产过程中材料往往处于复杂应力状态,适用于比例加载条件下
神经元作为神经动力系统的结构单元,承担着信息传递与加工处理的职责,其放电活动表现出丰富的动力学行为,比如分岔、周期解的存在与稳定.单个神经元通过电突触或化学突触与其他神经元紧密联系,共同维持机体机能的协调稳定,伴随着同步现象的发生.研究神经元的分岔机制及其耦合同步具有重要的意义.本文以McKean神经元模型为研究对象,主要研究两个方面:其一,研究具有突触电导和门控阈值的McKean神经元的非光滑分
尼罗罗非鱼(Oreochromis niloticus)是世界以及我国南方区域养殖的重要淡水鱼类之一。近年来随着我国水产养殖规模的扩大,罗非鱼病毒性和细菌性疾病多发,造成了严重的经济损
声波在多层介质中的传播规律是声波测井理论基础的一个重要方面。本论文主要研究了平面波在层状介质中的反射和透射性质、有限声束入射问题以及Lamb波和Rayleigh波的频散特性