面向机器翻译的E-Chunk获取与应用研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:c1s2d3n456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文的工作紧紧围绕E-Chunk的获取与应用展开,构成一个完整的体系.在E-Chunk概念基础上,作者研究了单语Chunk获取、文本对齐、E-Chunk获取、E-Chunk在EBMT的应用等问题.该文在前人工作的基础上创造性地提出了一些新的处理技术,取得了一些研究成果,其中包括:(1)提出了E-Chunk概念.E-Chunk是一种双语语段,它是基于语义定义的,具有语义自足性、复现性、可嵌套性等特征.因为E-Chunk内含了上下文环境,用于机器翻译中可起到消歧作用.(2)提出了时间复杂度为O(n)的子串归并算法.(3)提出汉英法律文献层次结构模型.模型描述了法律文献的层次结构特征及章、条、子条的连续性和对应性.基于该模型有效地实现了汉英法律文献的翻译块自动索引和对齐,并进一步用统计方法实现了句子对齐.(4)提出基于语料库的无双语词典英汉词对齐模型.(5)提出基于词典和语料库的多层次英汉词对齐模型.(6)提出基于统计的E-Chunk获取模型.(7)提出基于英语句法分析和英汉词对齐的E-Chunk获取模型.(8)提出以E-Chunk为重组单元的EBMT模型.
其他文献
灵活的业务提供能力,以及所具有的丰富的业务潜力,是以软交换为核心的下一代网络的一个亮点。但面对业已成熟却又缺乏新意的智能网,以及势在必行的下一代网络,我们必须思考一个问
该文结合CRM客户评价分系统的设计与开发,提出用WebService解决CRM系统发展将要面临的数据分布性和平台异构性问题.该文主要研究了采用WebService实现的客户评价分系统的结构
在SNMP规范之一的管理信息结构与标识规范中定义了这些属性.SMI对于MIB来说就相当于模式对于数据库.SMI定义了每一个对象"看上去象什么".SMIng从1999年开始研究,最初的研究目
后PC时代嵌入式系统应用日趋广泛和多样,嵌入式软件变得复杂和庞大,容易引发定位不当造成的地址冲突和小处改动引起整个模块重新编译等诸多问题。因此,现代嵌入式操作系统纷纷引
预测控制是于七十年代后期在工业过程实践中发展起来的一类新型计算机控制算法.它已经得到了广泛的研究和应用.预测控制通过预测模型、滚动优化、反馈校正把优化和反馈机制合