统计机器翻译的问题与思考

来源 :中国中文信息学会 | 被引量 : 0次 | 上传用户:hebehehe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
其他文献
本文主要介绍微软亚洲研究院自然语言计算组参加2009年第五届全国机器翻译研讨会(CWMT2009)评测的情况。本单位参加了全部5个评测项目中的2个子项:汉英新闻领域单一系统和汉英新闻领域系统融合两个评测项目。文章将简要介绍本单位统计机器翻译系统的实现框架以及阐述它们在评测数据上的性能表现,并针对结果加以适当分析。
本文介绍了哈尔滨工业大学语言技术研究中心参加CWMT09机器翻译评测的情况。我们参加了汉英新闻单一系统、汉英新闻系统融合、英汉新闻机器翻译和英汉科技机器翻译4个项目。在评测中,我们使用了HiTree和water两个统计机器翻译系统,两个词一级融合系统(WordComb1和WordComb2)和一个句子一级融合系统wMBR。本文对各个系统进行了简要的介绍,并给出了各个系统参加评测时的数据配置情况和最
本文介绍了我们参与CWMT2009机器翻译系统评测的系统ZZX_MT,它是一个统计机器翻译系统,同时结合了简单的句法知识,以解决中-英及英-中翻译中的重定序问题。我们将简单介绍系统的基本组成及其参与CWMT09的汉-英新闻翻译及英-汉科技翻译的评测情况。
本文介绍了中国电子信息产业发展阶段研究院参加2009年第五届全国机器翻译研讨会机器翻译评测的情况。我们参加了机器翻泽的三个领域的测试:汉英新闻领域,英汉新闻领域和英汉科技领域。参加评测的系统包括基于规则和模板的汉英系统、英汉系统,以及一个基于短语的汉英统计机器翻译系统.文章介绍了这几个系统的主要设计思路,并对评测实验结果进行了介绍。
本文给出了参加第五届全国机器翻译研讨会(CWMT2009)评测的系统介绍,包括基于短语的统计机器翻译模型以及两个系统融合模型。翻译系统首先对训练语料进行预处理,构造了一个基本系统,然后利用大小写敏感的4元语言模型恢复英文的大小写.预处理部分使用了规则的方法,对翻译中的数字进行了单独处理。系统融合评测提交了句子级和词级融合两个参评系统.
本文介绍了我们参与CWMT2009机器翻译系统评测的基于混合策略的汉蒙机器翻译系统。它是以基于短语的统计机器翻译系统为主,在训练时对于蒙古文进行了部分形态切分,用句法规则进行调序,用模板的方法处理了汉蒙量词翻译问题。本文简单介绍了系统的基本流程及其参与CWMT2009的评测情况。
本文主要介绍了内蒙古大学参评系统参加CWMT2009研讨会的技术报告,我们参加的项目评测任务是汉蒙日常用语统计机器翻译任务。这里主要介绍了该系统的主要框架、模型、实现细节及其评测结果.
层次短语翻译模型融合了短语模型和句法模型的优点,是当前统计机器翻译的主流模型之一.然而,传统的层次短语抽取方法在抽取过程中,只考虑了对齐一致性和规则长度的限制,没有考虑到句子中存在的短语搭配和高频骨干词,因此抽取出了大量冗余的泛化规则。对此,本文提出了相应抽取约束策略:1)采用对数似然比来确定短语搭配,并且在抽取过程中,把短语搭配当作一个整体语言单位;2)采用频率来识别句子中的高频骨干词,在抽取过
本文提出一种基于一致性网络和最小贝叶斯风险联合解码的统计机器翻译系统融合方法。首先利用N-best译文集合建立一致性网络,从一致性网络产生的新译文中选出得分最高的前N个译文,然后从这N个候选译文中选出具有最小贝叶斯风险的译文作为最佳译文.实验结果表明这种方法比直接使用一致性网络解码算法在BLEU-SBP上的表现要好。
会议