基于双向线性变换的可比语料双语词典抽取重排序方法

来源 :第十二届全国机器翻译研讨会 | 被引量 : 0次 | 上传用户:q372245556
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年来,一种基于词嵌入的线性变换方法在可比语料双语词典抽取任务上取得了显著的效果.这种方法假定双语词嵌入空间在翻译时满足线性关系,然而,在实际中,双语词嵌入空间的线性假设在单语词嵌入的训练中并不能得到很好的保证,这使得在源语言到目标语言和目标语言到源语言两个方向上学习到的线性变换并不一致.为此,对给定的待翻译词的翻译候选N-best 列表,本文综合了上述两个方向的线性变换得分,提出了一种基于双向线性得分的重排序方法.在汉英方向的双语词典抽取任务上的实验表明,相比单向线性基准方法,这种重排序方法能够显著提升抽取到的字典的准确度,在Top-1 排名上能够提升69%.
其他文献
由于汉语药品种类繁多,人工翻译药品说明书对译员专业水平要求较高,翻译成本较高.为了降低翻译成本,提高效率,本文根据药品说明书的特点,对药品用法用量机器翻译方
会议
  Current neural machine translation(NMT)usually extracts a fixed-length semantic representation for source sentence,and then depends on this representation t
会议
该文将深度学习技术应用于汉藏机器翻译任务中,采用了编码器-解码器结构.在编码阶段,首先将汉语句子中的每个词映射为定长的词向量,并通过循环神经网络压缩整个句子
会议
面向专利领域的机器翻译近年来已成为机器翻译的重要应用领域之一.本文提出了一个汉英专利文本机器翻译融合系统,该系统以规则系统为主导搭建,并把规则翻译方法和基
会议
  翻译模板是对自然语言现象高度的总结概括,也是机器翻译重要的资源,翻译模板的质量关系着机器翻译系统的效能,所以对翻译模板的编写一直是机器翻译领域研究的难题。本文采用
  In order to improve the efficiency of human translation,there is an increasing interest in applying machine translation(MT)to computer assisted translation(
会议
  HowNet is a Chinese-English Bilingual common-sense knowledge base,playing an important role in machine translation tasks.However,when fac-ing domain-specifi
会议
科技术语翻译要求高度的准确性和专业性,通过建立术语语料的领域知识标签,并基于待翻译术语的领域对训练语料进行筛选,可训练出针对领域的翻译模型,能极大改善科技
会议
  显著性检验常用来判断系统之间的性能差异是否来源于系统的性能改善而不是随机误差。用于机器翻译系统的显著性检验通常以句子作为基本的抽样单位,忽略了抽样样本之间的独
  机器翻译的发展有两个重要的维度,一是探索更为有效的数学工具对翻译的建模、计算等问题进行求解,二是使用丰富的先验知识来引导系统进行更加“合理”的翻译。我们发现二者