基于汉英双语语料库的翻译词典获取研究及实现

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:djing331
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该课题主要研究基于句子级对齐的汉英双语语料库,利用共现信息计算双语词汇之间的关联强度,从而建立词汇对译关系,获取翻译词典的方法.具体地讲,该文从如下几个方面进行了研究: 1.深讨了4种基于共现信息计算词汇对译关系的统计模型,分析比较各模型性能优劣.比较过程中,采用了一种新的双语词对集评测方法,该方法既体现了译文之间的相对关系又提高了评判人员的工作效率,合理而科学.2.探讨了基于双语语料库自动获取双语对译词对面临的主要问题及其形成原因,提出了相应的解决策略.对于间接共现问题,采用迭代抽取策略,模型的整体性能比传统的直接计算方法,有成倍的提高.3.实现了一个基于汉英双语语料库的翻译词典辅助获取原型系统,给出了系统的基本框架,介绍了组成系统的各模块功能及使用的主要技术.最后通过对得到的汉英翻译词对的评价验证了该系统的可行性和实用性.4.研究双语语料库规模与词典获取效果的相互关系.经实验发现,随着双语句对的增加,语料规模的扩大,词典获取系统将得到更多正确的汉英翻译词对,更高的语料利用率,以及稳定的系统整体性能,确保了用户的工作效率.
其他文献
该文针对中国流程制造企业自身生产管理的特点,深入分析了流程制造企业生产计划与控制的集成框架.并基于CIPS的理念,从系统建模的角度出发,提出了流程企业生产计划过程管理的
该课题针对动态联盟的项目管理,在联盟项目组织结构建立和联盟协同项目管理模式等方面进行了较为深入的研究工作.主要包括以下几个方面的内容:首先,该文具有创新性地提出了动
无线Mesh网络作为一种新型的无线网络,以其特有的优势获得了学术界和工业界的关注,具有广泛的应用前景。然而,无线Mesh网络资源无法适应于其用户数量及大数据业务的急速增加,
作为计算机信息系统正常运行的软件基础,操作系统在计算机系统安全中扮演极为重要的角色,一方面它直接为用户数据提供各种保护机制,如实现用户数据之间的隔离;另一方面为应用
随着计算机技术的发展,越来越多的领域要求使用可视化技术和虚拟现实技术来具体、形象地反映现实情况。为此人们开始探索各种各样的方法来构建具有真实感的虚拟场景,以逼真地反
森林火灾是一种破坏性极强的灾害,具有时间上的突发性、地点上的随机性、短时间内就造成巨大损失的特点。因此,做好森林火灾的扑救工作,提高火灾扑救的效率就显得尤为重要。
面向对象(Object-Oriented)技术是90年代软件工程发展的关键及焦点技术,面向对象的仿真,是当今仿真领域的热点研究方向之一。 论文首先分析了计算机仿真系统的一般性质和特
计算机辅助越来越多的家庭、用户对教育软件的需求量也越来越大.教育软件根据科目和内容的不同,分为很多类别,该文所研究的是化学教育软件的化学模拟实验部分.可制定模拟实验
该论文的主要工作内容包括如下:1.建立密码协议的新的安全模型;将密码协议与协议中用到的密码算法视为一个系统(称为密码协议系统),研究并建立密码协议系统的新的细粒度的安
该文围绕着支持ERP系统流程重构的工作流引擎系统设计与实现以及应用工作流引擎进行流程重构的实施方法展开研究.具体内容有:提出一套面向流程描述和流程重构的工作流模型和