基于分析和生成的复述与SMT语料扩展

来源 :哈尔滨工业大学学报 | 被引量 : 0次 | 上传用户:bianhao9527
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了解决统计机器翻译语料对调序现象覆盖不足的问题,采用复述方法对语料进行扩展.提出了一种基于依存分析和句子生成的复述方法.对句子进行依存分析得到依存树,然后从依存树生成多个自然语言句子.生成的句子与原句相比没有词汇上的改变,但可以在词序方面进行变换.实验表明方法在不引入额外资源的前提下,有效缓解了语料覆盖不足的问题,提高了机器翻译质量.
其他文献
历史上著名的哲学家对芝诺的“飞矢不动”的错误多有批判,但终究未击中要害。本文用数理方法分析了芝诺以孤立点代替极限点,以共性及不能出现的现象作为判别物体动、静状态依
为了缩短生物除锰工艺处理高铁高锰高氨氮地下水的启动时间,采用变动回流比、固定回流比、不回流3种启动方式,分别启动3根相同的生物除锰滤柱,考察出水回流对启动时间的影响.
翻转课堂融合了先进的教育理念以及现代化信息技术,这种教学模式在实际应用过程中能够尊重学生的主体性,使得教师在教学过程中能够充分发挥学生的主体作用。基于此,本文概述
在医院管理体系中,护士长是微观管理者,既是决策者,又是监督者,甚至是执行者。护士长在引导护理人员工作、促进学科发展等各方面起着极为重要的作用。但在临床工作中,护士长往往被
高校图书馆是高等学校的图书情报中心,作者分析了高校图书馆情报工作的特点,认为它不仅可以加速科学技术的发展,而且能够满足读者对信息情报的需要。并提出了发挥高校图书馆
为探讨极值概率分布模型(极值Ⅰ型、Ⅱ型、Ⅲ型分布)在工程场地重现期内极值风速预测中的适用性,以工程上常用的风速分布模型为依据,采用Monte Carlo数值模拟法分别产生服从指
在中国五千年的发展中,汉语言作为历史文化的载体,蕴含了中国传统文化的精髓,代表着中国的历史传承。元明时期,我国四大发明中的活字印刷术传到西方,也引起了西方国家对我国
为在空间操控任务中实施对翻滚非合作目标的安全逼近与抓捕,论文建立了描述航天器近距离相对运动的六自由度动力学模型,通过对模型的分析,提出了摄动引起的耦合和动力学耦合.
新生儿黄疸近年来有上升趋势,而新生儿高胆红素血症可引起新生儿脑损伤,使致残率、致死率明显升高.不同的护理模式对治疗新生儿黄疸有不同的疗效[1],而新生儿游泳是一项全新
0.25%氯霉素滴眼液为眼科常用药,临床上广泛用于预防和治疗细菌性结膜炎、角膜炎、沙眼等。其变态反应在临床上并不多见,最近我科遇到严重变态反应病例1例,报告如下。