【摘 要】
:
语言本身的复杂性给机器翻译带来了巨大的困难,对机器翻译结果的详细分析有助于有针对性地提高翻译系统的质量。本文在分析了现代汉语中情态词的分类基础上,选择了四组测试
【机 构】
:
东芝(中国)研究开发中心,北京100600
论文部分内容阅读
语言本身的复杂性给机器翻译带来了巨大的困难,对机器翻译结果的详细分析有助于有针对性地提高翻译系统的质量。本文在分析了现代汉语中情态词的分类基础上,选择了四组测试集(包含和不包含情态词的中文短句和长句),在中英、中日两个翻译方向上,对不同的四个翻译系统的翻译结果进行人工标注和错误分析,详细分析了情态词、句子长度以及语言对因素对翻译错误类型的影响。从情态词的角度,进一步提出了用于机器翻译系统的改进方案。
其他文献
青海省雄踞世界屋脊,地处青藏高原腹地,全省平均海拔4000米以上,生态地位特殊,被誉为"千湖之乡、江河之源"、"中华水塔"、"全球气候启动区"和"世界四大超洁净区之一",是中国
为了测试从加拿大引进的苜蓿新品种独角兽(Medicago sativa L.cv.Unicorn)的适应性及生产性能,以冲击波(Medicago sativa L.cv.Shockwave BR)和龙威6010(Medicago sativa
黑龙江是全国农业大省,也是畜牧业大省,更是草业大省.黑龙江是世界三大黑土带之一,全省拥有耕地2.29亿亩,农业人口人均耕地面积13亩左右,是全国平均水平的近10倍,耕地总面积
青藏高原是目前世界范围内最为独特的草地生态生态系统之一,该生态系统的稳定性及是否退化严重影响中国乃至全球生态安全.同时该生态系统面临超载放牧、鼠害频发、毒草丛生的
玉米秸秆是反刍动物粗饲料的重要来源之一,利用微生物发酵处理玉米秸秆,可提高其营养价值,促进消化吸收.本研究在实验室发酵秸秆饲草研发的基础上,分析了发酵玉米秸秆各营养
21世纪以来,短短的15年,中国草产业经历了三次具有历史意义的裂变式振兴.第一次振兴是国家生态保护建设的需求,第二次振兴是国家奶品质量安全的需求,第三次振兴是国家农业结
In this paper,for the low similarity computation accuracy of concept in the field of domain ontology mapping,formal concept analysis theory and rough set th
In order to avoid the influence from invalid rules in decoding,a method based on translation rules optimization is proposed for machine translation automati
In this paper,we propose a novel approach learning bilingual representations to predict quality estimation of machine translation.We use two bi-directional
Commas are widely distributed and used in Chinese and play important role in detecting boundary of basic units in sentences and discourses.Towards Chinese-E