【摘 要】
:
根据机器翻译的现状和实际需求,文中提出了一种基于E-Chunk的机器翻译模型.E-Chunk形式上是一个无翻译歧义的单词或单词串.基于E-Chunk的机器翻译,就是给定输入句子S,在双语E
论文部分内容阅读
根据机器翻译的现状和实际需求,文中提出了一种基于E-Chunk的机器翻译模型.E-Chunk形式上是一个无翻译歧义的单词或单词串.基于E-Chunk的机器翻译,就是给定输入句子S,在双语E-Chunk词典中选取一组可以与之进行最优匹配的双语E-Chunk,应用其中提供的双语转换信息实现语言的自动翻译.为获取双语E-Chunk必须首先在句子一级对齐双语文本.根据语料的特点,文中提出一种基于文本结构特征的法律文本对齐的工程化方法,并用这种方法实现了法律文本的对齐.Link-grammar是一种分析英语句子的计算机可读的文法,其表达能力等同于上下文无关文法.文中介绍了Link-grammar的基本理论.进而提出了一种基于Link-grammar的英汉双语E-Chunk获取和标注方法.
其他文献
该课题的研究内容是设计一种利用Internet和World Wide Web概念与技术的单位内部Intranet网络系统.该论文详细介绍了山东省建筑工程劳保费管理办公室组网的基本思想和设计过
该文对计算机集成制造系统、并行工程、工作流管理技术和计算机支持的协同工作等理论进行了论述,探讨了它们之间的相互关系和各自的特点,分析了计算机支持的协同工作的研究内
在众多的无损检测方法中,超声成像技术是一种令人瞩目的新技术,并随着电子技术和计算机技术的应用而迅速发展.该报告的第一部分结合"超声彩色成象与分析系统"讨论以计算机技
该文首先对目前最为流行的网络协议——TCP/IP协议进行了充分的分析,尤其是对黑客最容易攻击的几种常见协议(如TCP、UDP协议)的机理及实现方法进行了深刻的研究.与此同时,该
该文分析了国内外研究基于Internet的实进语音通信QoS问题的进展情况,结合该文提出的呼叫中心改进方案建立了端到端实语音通信的模型,从多方面的给出解决QoS问题的方法以及实
该文针对CD400BXICT系统的技术特点,按照设计要求设计了该系统中的数据采集部分,实现对CD400BXICT系统中的128路探测器信号的实时采集、校验和存储.设计以I/O扩展卡的形成,按
该文通过分析C程序中非局部跳转控制流的特点,提出了一个通过等价程序变换消除非局部跳转流的方法,并对该方法在不同情况下的正确性进行了阐述和证明.我们的方法是采用goto和
该文对多输入多输出系统模糊解耦的一些问题进行了讨论.针对传统解耦控制系统对参数变化敏感的问题,引入模糊的思想,希望能将模糊方法"不敏感"的优点应用于解耦系统中.文中主
一个网系统可能对应着多个(无限多个)进程,这为利用进程来分析系统的行为还来了不便.为此,文[36]提出了进程表达式的概念,并对有界网的进程表达式进行了研究.文[37]对可重复
视频点播系统作为一种典型的多媒体应用受到了充分的重视.国内外进行了很多这个方面的研究和实验,取得了不少的成果.该文在前三章简要介绍了国内外的一些研究以及他们的成果