基于短语的统计机器翻译中的调序问题研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:cdna3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器翻译是利用计算机系统在自然语言之间进行自动转换的过程,是信息时代跨语言交流的一项重要工具。多年来,机器翻译领域的研究取得了长足发展,但机器翻译系统的译文在很多应用场合依旧远未达到令人满意的水平,原因之一是统计机器翻译技术中存在一系列尚待有效解决的困难问题,如何更好地解决这些问题对机器翻译的研究有着深刻的影响。本文针对机器翻译中的一项重要的困难问题,即调序问题进行深入研究。调序问题来源于自然语言之间的语序和句法间的差异,选择正确词序的能力对机器翻译系统的译文质量有着显著影响。本文从预调序的角度入手,对调序问题及相关的语言现象进行分析,并结合机器翻译系统的原理和特性,在总结国内外现有的预调序方面的研究成果的基础上,提出了两种用于基于短语的机器翻译系统的预调序方法。本文首先提出一种基于词对齐的调序方法,该方法使用词对齐信息抽取调序所需的结构化数据,并用于训练调序模型,因此不依赖于源语言句法分析器,可应用于资源匮乏的语言。之后,本文结合具体语言对的特点以及语言学知识,提出了一种基于句法的调序方法,在本文提出的调序概率模型框架的基础上,将概率统计方法和语言学规则方法予以结合,以在树库等语言学资源存在时取得更好的调序性能和翻译质量。本文通过对调序模型的调序性能和基于调序模型的翻译系统的译文质量进行评测,并通过实验结果证明了本文提出的调序方法的有效性。
其他文献
[目的]1、采用免疫组化法检测宫腔粘连组织与正常子宫增生期内膜组织中TGF-β1、MMP-9、E-cadherin表达,为宫腔粘连发病机制及相关治疗的研究进一步提供依据。2、分析宫腔粘
目的:伴有全血细胞减少的系统性红斑狼疮(SLE)患者,目前临床缺乏有效治疗方法。本课题拟研究骨髓间充质干细胞(BMMSCs)N-钙黏蛋白(N-Cadherin)对MRL/lpr狼疮鼠成骨及造血的影
背景:类风湿性关节炎(rheumatoid arthritis,RA)是受到遗传、激素和环境等因素共同影响而引发的一种缓慢发展、关节不断受到损害最终导致自主功能困难为主的自身免疫性疾病。RA
在地震物理模拟技术中,对物理模型的数据测量是非常重要的一个环节。根据不同的采集设备,可以构建不同功能的超声测试系统。以数字示波器为采集卡的测试系统主要用于小模型的多道数据测量,以高精度采集卡搭建的测试系统主要运用于大模型的大数据量测量。本文以LabVIEW为编程软件,结合硬件设备分别设计了这两种测量系统。数字示波器是最常见的测量仪器。现代的数字示波器功能强大,往往都会配备软件。这种软件功能繁多,操
目的:通过对各影响外科手术治疗耐药性肺结核的术后并发症发生及术后疗效因素的综合分析,为临床提供手术时机的选择提供依据。方法:通过回顾性分析2010年1月-2017年1月共55例
中国几十年的城市化与工业化导致相当一部分农田土壤铅镉含量已达到重金属污染程度。国内采用化学钝化技术治理时,经常侧重于某类或某种钝化材料的应用,容易导致钝化重金属的种类以及效果上的欠缺,因此本文将矿物肥料与生物炭联合起来研究它们对镉铅污染土壤的修复效果。论文依托“矿物肥料对农田土壤的调理与重金属修复技术方法研究(重点)”项目,进行了前期的室内吸附实验,中期的动态淋滤实验,后期的盆栽实验。研究发现矿物
研究背景:心力衰竭(HF)几乎是所有心脏疾病的终末阶段,其发病率、死亡率逐年攀升,给人类造成了极大的经济负担和生活压力,因此及时准确识别慢性心力衰竭患者是至关重要的。心
利用势流理论分析波浪与结构相互作用时,边界元法是一种经典的数值手段,目前已经发展得相当成熟,但在应用中仍面临着一些困难。其中一类重要问题是,处理不光滑边界条件时,边界元的解会呈现出不光滑、不连续的特点。最常见的情形是,在结构棱边或角点附近,势函数的空间导数往往会产生突变,数值剧增,精度下降。通常的做法是对问题加以简化,忽略这种奇性,或者是单方面加密网格,以期获得收敛的结果。而事实上,这些奇异性可能
不同尺度耦合效应在自然科学和实际工程应用中普遍存在,例如化学工程中的周期振荡反应,生物群落的生灭演化,神经元细胞膜的簇发放电活动以及绳系卫星不同尺度引起的快慢行为等。因此,国内外的非线性动力学专家针对动力系统中存在的不同尺度耦合效应展开了广泛且深入的研究。本文主要致力于研究三维连续时间动力系统的快慢动力学行为,其中主要的内容如下几个方面:1、对于普遍存在不同尺度耦合效应的动力系统,其可以分离为快慢
由于非线性差分格式在数值计算过程中不可避免地需要迭代,从而需要耗费大量的计算时间,所以构造线性化的差分格式是数值研究领域一件很有意义的工作。作为对非线性长波的进一步考虑,需要对Rosenau-RLW方程添加粘性项+uxxx,即得到Rosenau-KdV-RLW方程,但这些方程都少有解析解,所以研究其数值解就很有理论价值和应用价值。首先对Rosenau-KdV-RLW方程的初边值问题提出了一个具有二