基于预训练模型的机器翻译译文检测方法

来源 :情报工程 | 被引量 : 0次 | 上传用户:bach88888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器翻译译文检测任务旨在大规模文本中判别每句话是机器翻译译文还是人工翻译译文。现有的机器翻译译文检测方法大都采用统计的方法提取特征,但是基于统计的方法提取特征能力有限,严重依赖于离散的手工特征,而神经网络模型使用分布式表示,构建代价较低且能表达细粒度的句法、语义特征差别。在本文中,我们提出使用预训练语言模型和双向门控循环单元模型结合,提取机器翻译译文的语言风格、惯用词等隐层表示作为特征来检测机器翻译译文,检测结果相较之前的统计方法有很大的提升。本文尝试使用所提方法过滤混合机器翻译译文的双语语料,过滤后的语
其他文献
空间是古镇文脉传承与发展的平台,是古镇保护性开发的人文基石。古镇空间包括行政空间、物质空间、非物质空间3大系统。旅游开发促使古镇空间产生重大变化,主要体现在物质空
白光OLED经过多年的发展,取得了显著成果,但是器件的性能仍然受到工艺、材料的限制。本论文主要研究在现有材料基础上,通过对器件结构的设计优化得到高效稳定的白光器件。主
[摘 要]内部审计对于许多的大型公司来说作用越来越明显了,甚至可以认为是公司的第三道风险管理的防线。公司开展财务共享后,其所属子公司和分支机构涉及的审批内容以及审批的范围不再是独立考虑的,这对于内部审计的形式和内容将有非常大的影响。基于此,笔者着重探讨了财务共享在企业如何以财务分工的形式发挥其自身的优势、在实际工作中存在的问题和在技术上所面临的挑战,并且如何通过企业之间的相互协作建立起公共的财务资
为在技术、设备匮乏等环境因素下实施高空钢桁架结构吊装,从施工现场及周边区域实际条件分析,采取高空牵引滑移措施,解决了无专业顶推设备、无大型吊装设备等难题。在施工推
目的分析多次捐献机采血小板对外周血常规影响。方法选取2018年1月至2019年10月自愿捐献机采血小板,且捐献次数为15~40次的献血者80例进行分析,观察多次捐献机采血小板对献血
“十三五”期间,我国出版业紧紧围绕党和国家工作大局,深化改革,开拓创新,转型升级,融合发展质效提升,取得了显著成就,圆满完成了《新闻出版广播影视“十三五”发展规划》中
目的观察改良后下肢抬高垫在足踝外科中后足术后患者中的应用效果。方法选取本科2019年1至12月收治的100例足踝外科中后足手术患者,随机分为两组,观察组应用改良后的下肢抬高
依据非伤病训练中断情况下高水平运动员训练系统性可能受到破坏的现实,分别从训练中断的影响、运动能力的迁移训练、应对训练中断的训练安排三个方面,对高水平运动员和非高水
针对从地面到空间由于重力变化引起的空间机械臂的末端轨迹跟踪问题,提出了一种基于多Lyapunov函数的PD系统切换策略。根据运行环境的不同,将空间机械臂系统分为地面和空间2
针对低莱斯因子的慢衰落时变多径信道条件下,难以有效利用信号能量,导致系统误码性能差,单纯的基于最小均方误差准则均衡(Minimum Mean Squared Error,MMSE)技术不能够有效降