面向汉阿句法短语库构建的阿语短语分析

来源 :第十二届全国机器翻译研讨会 | 被引量 : 0次 | 上传用户:lxw19831201
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于平行语料库的机器翻译研究是机器翻译的研究重点。平行语料库为机器学习翻译所需的句法规则提供了保障,也为统计机器翻译提供了资源。本文选择联合国官方资料库作为汉阿文本对齐语料,建立短语对齐.首先,利用斯坦福句法分析器对语料进行句法标注加工,进而抽取双语短语结构,构建汉阿句法短语库.在短语库的构建过程中,发现阿语语料的句法标注存在一些问题,因此本文着重对阿语标注中的这些问题进行分析.本文共抽取了9 种阿语短语结构共43796 条,统计短语结构分布,并着重对名词性短语结构和动词性短语结构中的句法标注错误实例进行归类总结,分析错误产生的原因.
其他文献
21世纪以来,短短的15年,中国草产业经历了三次具有历史意义的裂变式振兴.第一次振兴是国家生态保护建设的需求,第二次振兴是国家奶品质量安全的需求,第三次振兴是国家农业结
  In this paper,for the low similarity computation accuracy of concept in the field of domain ontology mapping,formal concept analysis theory and rough set th
会议
  In order to avoid the influence from invalid rules in decoding,a method based on translation rules optimization is proposed for machine translation automati
会议
  In this paper,we propose a novel approach learning bilingual representations to predict quality estimation of machine translation.We use two bi-directional
会议
  Commas are widely distributed and used in Chinese and play important role in detecting boundary of basic units in sentences and discourses.Towards Chinese-E
会议
  语言本身的复杂性给机器翻译带来了巨大的困难,对机器翻译结果的详细分析有助于有针对性地提高翻译系统的质量。本文在分析了现代汉语中情态词的分类基础上,选择了四组测试
  本文首先对机器翻译引擎的构建思路进行了全面的规划,简要介绍了 Moses 3.0 系统及其特性,理清了引擎的构建思路、形成了引擎构建的总体规划.随后把机器翻译引擎的构建与部
会议
  Phrase Treebank is an important resource for Natural Language Processing research and practical application.For Vietnamese,we lack this kind of Treebank res
会议
本文的研究任务为知识库的多语言自动扩展,并使用统计机器翻译的技术将知识库中实体标签翻译到另一种语言.为了解决知识库中特定词汇较多及特定领域双语平行语料缺
会议
  基于《傲慢与偏见》一对五平行语料库,以百度在线翻译的《傲慢与偏见》为重点,选取叠词作为研究对象,进行百度在线翻译与人工译本在12 类叠词翻译上异同的对比,以及百度在线