论文部分内容阅读
进入21世纪以来,伴随着通信技术和互联网技术的快速发展,全球化贸易、科学、技术和文化交流活动日益增强,克服语言交流障碍的需求也在同步增长。虽然传统人工翻译可提供令人满意的翻译服务,但在保证翻译质量的反面,也造成了其效率低下、代价昂贵的缺点,难以满足大量的翻译需求。因此,机器翻译越来越引起人们的广泛重视。在此背景下,笔者通过在北京趣加科技有限公司自然语言处理组(NLP组)的实习经历对机器翻译有了更深的了解,并且发现机器翻译也存在着不少问题,比如多义词和口语表达的翻译错误。在此过程中,笔者意识到传统翻译研究中的功能学派“目的论”非常适合指导机器翻译优化工作。本文将研究对象限定为统计机器翻译(SMT)。研究的主要内容为以趣加公司翻译系统及其语料为例,识别目前SMT专门化翻译的主要问题,并在“翻译目的论”的指导下提出有针对性的人工优化策略。需要说明的是,当前的主流的机器翻译系统多是以英语为桥梁,因此本文研究的也是英葡之间机器翻译,而非中葡之间的机器翻译。本文采用的研究方法主要为文献研究法和案例分析法。首先,本文采用了文献研究法,以纸质书刊材料和网络文献为基础。纸质书刊材料包括中外文相关图书和期刊杂志等。其次,本文采用了案例分析的研究方法,以趣加公司开发的统计机器翻译系统为例,展开定性分析。本文的创新点主要在于从翻译理论的角度出发研究机器翻译。由于机器翻译系统的构建主要依据数学理论,翻译过程较为抽象化,所以很少有学者从传统翻译理论角度对其进行研究,笔者选取的“目的论”更是鲜少有学者涉足。笔者认为,随着人工智能和机器学习的发展,人工翻译和机器翻译之间的差异会越来越小,翻译理论对机器翻译研究的适用性会随之提升,笔者希望能以本文为丰富本领域研究成果做出微薄贡献。通过研究,本文得以总结出电子游戏领域SMT专门化翻译的典型问题,并将其分为“预处理模块中的问题”和“翻译模块中的问题”两类。然后在“翻译目的论”的指导下,从人工干预角度提出了相应的优化策略,对于从翻译理论角度发展机器翻译有一定的启发作用。在中国,自然语言处理学科尚处在新生阶段,在多数人眼中翻译专业学生和计算机系学生还是没有任何交集的两个群体。但是,在我国机器翻译的发展中翻译专业学生的参与是非常必要的,特别是小语种专业。笔者希望通过本文引起葡萄牙语专业学生对机器翻译研究的兴趣,为其学习研究提供一丝线索。