基于二维词汇化领域知识的日汉科技术语翻译方法研究

来源 :第十二届全国机器翻译研讨会 | 被引量 : 0次 | 上传用户:dorisnanjin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
科技术语翻译要求高度的准确性和专业性,通过建立术语语料的领域知识标签,并基于待翻译术语的领域对训练语料进行筛选,可训练出针对领域的翻译模型,能极大改善科技术语翻译质量.这对于机器翻译、词典自动编纂、跨语言信息检索等自然语言处理任务都具有重要的实用价值.本项研究以日汉科技术语翻译为研究目标,通过自动获取日语术语的二维领域知识,包括语义范畴标签和应用场景标签,可以对日语术语进行领域归类.该方法应用到统计机器翻译中,可以自动标注日语术语(或句子)的二维领域知识,生成测试集和开发集的领域标签集合,进而筛选训练数据.实验表明,仅利用部分训练数据就可以获取与原始训练数据可比较的翻译结果,验证了本方法的有效性和可行性.本研究有助于解决面向科技术语的统计机器翻译的领域自适应问题.
其他文献
基于平行语料库的机器翻译研究是机器翻译的研究重点。平行语料库为机器学习翻译所需的句法规则提供了保障,也为统计机器翻译提供了资源。本文选择联合国官方资料库
会议
  Machine Translation(MT)evaluation is very important for a MT system.In this paper,we investigate an improved Cilin-based smoothed BLEU(BLEUS-syn).As the pos
会议
  深度神经网络是深度学习技术的代表,是一种模拟人脑的计算模型,已经在人工智能的很多领域取得了突破性的成果。基于神经网络的机器翻译是利用深度神经网络进行源语言到目标
由于汉语药品种类繁多,人工翻译药品说明书对译员专业水平要求较高,翻译成本较高.为了降低翻译成本,提高效率,本文根据药品说明书的特点,对药品用法用量机器翻译方
会议
  Current neural machine translation(NMT)usually extracts a fixed-length semantic representation for source sentence,and then depends on this representation t
会议
该文将深度学习技术应用于汉藏机器翻译任务中,采用了编码器-解码器结构.在编码阶段,首先将汉语句子中的每个词映射为定长的词向量,并通过循环神经网络压缩整个句子
会议
面向专利领域的机器翻译近年来已成为机器翻译的重要应用领域之一.本文提出了一个汉英专利文本机器翻译融合系统,该系统以规则系统为主导搭建,并把规则翻译方法和基
会议
  翻译模板是对自然语言现象高度的总结概括,也是机器翻译重要的资源,翻译模板的质量关系着机器翻译系统的效能,所以对翻译模板的编写一直是机器翻译领域研究的难题。本文采用
  In order to improve the efficiency of human translation,there is an increasing interest in applying machine translation(MT)to computer assisted translation(
会议
  HowNet is a Chinese-English Bilingual common-sense knowledge base,playing an important role in machine translation tasks.However,when fac-ing domain-specifi
会议