计算机辅助翻译平台的关键技术研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:q344494
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术和通信技术的迅猛发展,人与人之间的时空距离骤然缩短,尤其是我国加入世界贸易组织(WTO)以来,中国人民与世界人民的距离进一步拉近,全球化进程已使整个世界紧缩为一个“地球村”。在这个“村落”里,各国人民交流日益频繁,这无疑给翻译领域带来了巨大的商机。例如,当跨国公司在全球市场上出售其产品时,往往需要将整套的用户手册翻译成多国语言,以方便各国用户阅读和使用。这些翻译内容往往任务庞大,而传统的人工翻译手段往往速度非常慢,且容易导致同一个技术术语在不同场合中有不同的翻译结果,翻译质量很难保证。为了改变传统翻译行业的生产方式,提高译员的翻译效率和翻译质量,翻译行业进行了大量的信息化建设,其中最引人注目的是计算机辅助翻译技术(CAT)得到了广泛使用。通过大量实践证明,计算机辅助翻译技术的使用能够大大提高译员的劳动效率。目前市场上已经存在的辅助翻译软件,比如Trados、Deja Vu X等,它们虽然较好地实现了辅助翻译的理念,但依然存在两个方面的不足:一方面是对中文支持比较差,不方便中国翻译工作者的使用;另一方面是辅助翻译过程中的每一步都需要人工的干预,这使得这些软件在降低翻译工作者劳动量、提高翻译质量等方面的作用时还不能满足广大翻译工作者的需求。 本文对服务于辅助翻译平台的一致性问题、语料匹配问题和任务划分问题的关键技术问题进行了研究,设计并实现了一个完整的辅助翻译平台。其中基于词效应的术语提取算法用于抽取翻译任务中多次出现的有意义的术语,针对每一个特定的术语给出统一的翻译结果,从而解决翻译一致性问题。实验结果表明:该算法比单纯的基于互信息、T测试度、接续指数等统计方法在准确率和召回率上都有较好的表现。大规模语料匹配算法用于自动从背景语料库中检索出与当前待翻译句子或短语最相似的翻译项,协助用户翻译。该算法先对背景语料库进行粗匹配,从大规模的背景语料库中选择一个规模相对很小的候选集合,对候选集合的每一个结果进行细匹配。粗匹配的速度与语料规模无关,从而大大提高了匹配速度,也保证了准确率和召回率。基于任务均衡的翻译任务划分算法用于将待翻译任务划分为若干难度大致相当的子任务,同时保持子任务的语义完整性,实现翻译团队的协同工作。
其他文献
随着网络技术的发展,“首都之窗”——北京市政务门户网站不断的完善,系统规模变的越来越大,用户如果要登录多个应用系统,不仅要面对多个登录界面,可能还要记忆不同的用户名
随着网络环境逐步向公共的、开放的、复杂的、大规模的网络环境发展,在这种新型的网络环境下开发的功能强大、需要大量资源的科学计算和协同应用也越来越复杂,具有时间、空间
XML以其可扩展、灵活、平台独立、简单和规范等特点使其在互联网中的应用越来越广泛,尤其是在网络领域表示数据方面也越来越重要。所以,迫切地需要寻找一些有效的方法以便从
随着计算机的普遍使用,计算机软件对国民经济的发展起着越来越重要的作用,大到航天飞行器上的软件程序,弹道导弹上的软件,小到我们日常的计算器,这些都是计算机软件。可见我们的生
随着半导体制造工艺的不断改进,处理器的功耗迅速上升。功耗以热能的形式向外散发,使处理器的温度不断上升。处理器的工作温度超过阈值温度时,就会使处理器的工作变得不稳定,
随着网络通讯技术和仿真技术的发展,集散控制系统的全范围仿真正在向所谓“虚拟”技术方向发展。这给电厂仿真培训系统带来了新的发展机遇和开发思想。本文在对虚拟DPU技术、
随着大型复杂计算需求的扩大,人们把高性能计算更多的应用于数据挖掘、图像处理业务、基因测序对比处理等数据处理领域。科学计算规模的迅速膨胀,传统的串行计算已不能满足需
随着互联网时代的到来,网络信息资源成爆炸式增长。然而伴随着互联网信息的越来越巨大,网络用户想要找到自己所需的信息就如大海捞针一样,为了更加方便、快捷并有效的利用网络上
随着整个社会信息化程度的提高,手机正日益成为人们生活中不可缺少的一部分。最初的手机和家里的有线电话一样,只有打电话的功能。随着手机技术的发展,手机的功能越来越多,手
随着企业信息系统的广泛使用,系统安全问题受到越来越多的关注,而访问控制技术是解决安全问题的关键。目前我国大部分企业均采用传统的访问控制技术,自主访问控制技术(DAC)和