面向机器翻译的E-Chunk获取与应用研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:c1s2d3n456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文的工作紧紧围绕E-Chunk的获取与应用展开,构成一个完整的体系.在E-Chunk概念基础上,作者研究了单语Chunk获取、文本对齐、E-Chunk获取、E-Chunk在EBMT的应用等问题.该文在前人工作的基础上创造性地提出了一些新的处理技术,取得了一些研究成果,其中包括:(1)提出了E-Chunk概念.E-Chunk是一种双语语段,它是基于语义定义的,具有语义自足性、复现性、可嵌套性等特征.因为E-Chunk内含了上下文环境,用于机器翻译中可起到消歧作用.(2)提出了时间复杂度为O(n)的子串归并算法.(3)提出汉英法律文献层次结构模型.模型描述了法律文献的层次结构特征及章、条、子条的连续性和对应性.基于该模型有效地实现了汉英法律文献的翻译块自动索引和对齐,并进一步用统计方法实现了句子对齐.(4)提出基于语料库的无双语词典英汉词对齐模型.(5)提出基于词典和语料库的多层次英汉词对齐模型.(6)提出基于统计的E-Chunk获取模型.(7)提出基于英语句法分析和英汉词对齐的E-Chunk获取模型.(8)提出以E-Chunk为重组单元的EBMT模型.
其他文献
灵活的业务提供能力,以及所具有的丰富的业务潜力,是以软交换为核心的下一代网络的一个亮点。但面对业已成熟却又缺乏新意的智能网,以及势在必行的下一代网络,我们必须思考一个问
近年来随着大数据技术与深度学习算法的不断发展,医学图像这个积累了海量图像数据的领域逐渐吸引了人们的注意力,成为了一个新的研究热点。如何有效地、准确地分类这些海量的未
该文结合CRM客户评价分系统的设计与开发,提出用WebService解决CRM系统发展将要面临的数据分布性和平台异构性问题.该文主要研究了采用WebService实现的客户评价分系统的结构
微分代数系统,包含微分代数方程及其初始条件和边界条件,以微分方程表示物理世界的运动和变化,以代数方程描述物理世界的统一和守恒,在工程领域数学建模中具有重要的意义和普遍的
在SNMP规范之一的管理信息结构与标识规范中定义了这些属性.SMI对于MIB来说就相当于模式对于数据库.SMI定义了每一个对象"看上去象什么".SMIng从1999年开始研究,最初的研究目
在当前日益复杂的室内空间结构中,基于室内地图的服务是众多用户的一个关键痛点。在移动互联网的背景下,基于位置的服务作为最为关键的技术之一已经被广泛应用于交通、物流、人
近年来,随着移动互联网的迅速发展,移动智能设备的普及率已经非常高,移动应用的数量也急剧增长,而移动应用一般都采用客户端服务器端(C/S)架构,因此,客户端和服务端的数据同步问题
学位
后PC时代嵌入式系统应用日趋广泛和多样,嵌入式软件变得复杂和庞大,容易引发定位不当造成的地址冲突和小处改动引起整个模块重新编译等诸多问题。因此,现代嵌入式操作系统纷纷引
预测控制是于七十年代后期在工业过程实践中发展起来的一类新型计算机控制算法.它已经得到了广泛的研究和应用.预测控制通过预测模型、滚动优化、反馈校正把优化和反馈机制合