口语解析与短语翻译对自动抽取方法研究

来源 :中国科学院自动化研究所 | 被引量 : 0次 | 上传用户:dongchangnie
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
口语翻译是语音、语言技术领域重要的研究方向之一,具有巨大的应用价值。口语翻译涉及到语言学、计算机科学、语音识别、语音合成和通讯等多种学科和技术,开展这项研究具有非常重要的科学意义。 随着各国人们在文化,经济,体育等各方面的日常交流日趋频繁,口语翻译越来越受到人们的关注。本文针对基于中间语言的口语翻译方法中的口语解析问题和基于统计模型的口语翻译方法中的短语翻译对自动抽取问题以及口语翻译系统实验平台建设等几个方面做了相关的研究和实现工作,主要内容归纳为如下几点: 1.论文在面向中间转换格式(InterchangeFormat,IF)【"NESPOLE",2002】的口语解析方法研究方面,提出了一种基于语义分类树的汉语口语浅层语义解析方法,用来获取汉语口语句子的浅层语义领域行为(IF的一部分)。该方法利用统计模型从训练语料中自动获取语义规则构造语义分类树,并利用语义分类树对句子中和领域行为密切相关的词语进行解析,然后对多个词的解析结果利用统计解析模型进行选择和组合,从而生成句子的领域行为表示。规则自动获取方法避免了人工制定规则的繁琐性和主观性,保证了解析具有较高的鲁棒性;利用统计模型对领域行为各部分进行组合,避免了对IF表达能力的影响;与HMM相比,语义分类树扩大了解析窗口,更好地利用了上下文信息。实验结果表明:这种方法在限定领域内进行汉语口语浅层语义解析具有较高的准确率和鲁棒性。 2.基于统计模型的口语翻译方法是目前口语翻译研究领域中非常重要的方法。基于短语的统计翻译方法与基于单个词的统计翻译方法相比,可以更好地处理句子中短语内部词语之间的关系,从而有效地提高机器翻译系统的性能。基于短语的统计翻译方法之一把短语翻译对作为知识源加入到系统中,这样整个系统的性能对于使用的短语翻译对的质量具有非常大的依赖性,针对这个问题,论文提出了一种改进的基于HMM的短语翻译对抽取方法,从大规模训练语料中自动抽取高质量的短语翻译对,作为统计口语翻译的知识源。这种方法首先利用HMM对双语句子进行双向对齐,然后根据对齐的结果抽取短语翻译对,针对不同的对齐情况利用词语翻译概率作不同的后处理工作,提高了短语翻译对的质量。实验结果证明,这种方法抽取的短语翻译对具有较高的质量。 3.在上述工作和已有技术的基础上,我们建立了英汉口语翻译系统实验平台,集成了语音识别、语音合成和多种口语翻译方法,并实现了多种翻译方法之间的有效结合,为口语翻译的深入研究提供了一个较好的实验环境。
其他文献
智能建筑是信息时代的产物,是以计算机和网络为核心的信息技术向建筑行业的应用与渗透。它与传统的建筑相比,具有作业流程更为有效,综合运行成本更低,物业管理效率更高以及综合服
随着计算机技术的快速发展,计算机系统的广泛应用,系统的软件老化(software aging)导致系统性能衰退甚至崩溃的现象越来越明显。软件恢复(software rejuvenation)是一种针对
最短路径问题是图论的经典问题,其广泛应用于网络科学、路径规划、计算机科学等领域,是科学领域多个学科的重要理论支撑,是工程领域解决方案的理论摹础,随着现实需求的日益增
本文主要研究了无线传感器网络的定位算法,主要有一下几个方面:  (1)对于经典的基于测距的定位方法,重点研究了接收信号强度指示法,并针对其误差较大的缺陷,对结果进行修正,仿真
随着社会发展的需要,无线局域网(Wireless Local Area Networks,WLAN)这项技术正以前所未有的速度发展。WLAN 的终端设备是其中一个非常重要的组成部分,其中终端设备的无线网
本文对脉冲涡流(Pulsed Eddy Current,简称PEC)探伤技术进行了分析和应用。脉冲涡流检测技术是近几年来迅速发展起来的…种无损检测的新技术,因为其具有宽频谱激励方式的特点
激光以其一种新兴的能源形式,有着巨大的优势。随着激光能源的出现,激光在工业、国防、医学、教育等各行各业有着广泛的运用。如激光淬火,激光熔覆,激光表面改性,激光合金化,激光焊
本文应用信息理论和优化学习等知识,研究了多种情况下的盲混合物信号的自适应分离法,并将得到的理论结果应用到现实及模拟信号处理中,进行仿真试验验证.论文首先介绍了盲信号
近年来,随着中国改革开放的全面深入,电子通信产业也得到了长足的发展,各种消费类电子产品销量也年年强劲增长,如数码相机、MP3、手机、笔记本电脑、摄像机、人造卫星、航空航天
本论文中,以一阶倒立摆系统为研究对象,重点研究了其模糊控制方法,设计出相应的模糊控制器,创建了一个理想的控制理论研究平台。首先,作者对倒立摆系统进行分析建模,推