语义分析和语言生成在机器翻译中应用的研究

来源 :苏州大学 | 被引量 : 1次 | 上传用户:titicool
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语义分析、语言生成以及机器翻译都是自然语言处理领域的重要研究方向。其中语义分析旨在把自然语言转化为语义表达式,而语言生成是将语义表达式转化为自然语言,可以说语言生成是语义分析的逆过程。本文研究内容包括如下三个方面:围绕语义分析,本文分别探索了基于层次短语的统计机器翻译和神经机器翻译在语义分析中的应用。具体地,首先,针对语义分析任务特点,从三个方面改进现有的层次短语翻译框架,提高语义分析的性能:第一,从语义表达式中获取到更详细的语法和结构信息,细化同步上下文无关文法中的非终结符;第二,探索多种不同词对齐方式,分析并归纳出适合语义分析的对齐方式;第三,提出了基于近义词的未登录词翻译规则生成方法。其次,探索了多语言的语义分析方法,在传统编码—解码框架上提出了双编码—解码模型。实验结果表明,多语言输入能有效提高语义分析性能。围绕语言生成,本文也分别探索了基于层次短语的统计机器翻译和神经机器翻译在语言生成中的应用。具体地,针对语言生成任务的特点,从两个方面改进现有的层次短语翻译框架:第一,探索几种不同对齐方式,分析并归纳出适合语言生成的对齐方式;第二,针对n-best翻译结果,提出一种基于预测问题答案类型的过滤方法,进一步筛选出最优的语言生成结果。其次,本文还探索了神经网络机器翻译在语义表达式到多语言的语言生成中的应用,在传统编码—解码框架下提出了编码—双解码模型,实验结果表明,该模型能够有效提高语言生成性能。最后,探索了语义分析和语言生成在机器翻译中的应用。先将一种自然语言转化为语义表达式,再将语义表达式转化为另一种自然语言。为缓解转化过程中产生的错误积累,本文提出使用基于n-best语义分析结果的语言生成方法来提高翻译性能。
其他文献
话剧表演是话剧艺术的重要组成部分。本文从表演体系的多元化、表演元素的多元化、表演风格的多元化三大理论层面,集中于多元化的视角,论述了当前我国话剧表演多元化的主要审
长江是世界上水生生物多样性最为丰富的河流之一,也是维护我国生态安全的重要屏障。2019年年初,农业农村部等三部委联合发布了《长江流域重点水域禁捕和建立补偿制度实施方案》
报纸
<正>内蒙古敖汉旗境域生态环境优良,是全球环境500佳地区。土地资源丰富,全旗耕地面积380万亩。敖汉旱作农业系统,是全球重要农业文化遗产。敖汉旗是世界小米之乡,小米产业发
随着泰国巴育政府四年来首次开放新党登记,近年来相对平稳的泰国政治局势再次暗流涌动。得益于保守阵营在2017年宪法中的政治布局,巴育很可能连任总理,从而延续保守阵营对国
随着2003年1月1日新保险法的实施,车险条款、费率改革、财产险公司经过核准可以经营短期健康险和人意险,国内保险市场进入了一个新的发展阶段。在注重产品功能的创新和价格的精
为了降低测量误差,提出了一种具有分布式绕组的轴向磁阻式旋转变压器,并对一些结构参数进行了相应的优化分析。说明了这种新型旋转变压器的结构组成,在每极每相齿数不同的情况下
本文从认知语言学的基本观点出发,借助传统的比较方法,在前辈研究的基础上,从实证描写和理据探究两个方面,着重论述&#39;只要p,就q&#39;区别于&#39;如果p,就q&#39;的一个特征
人类有机阳离子转运体2(OCT2,SLC22A2)是一种有机阳离子的多特异性转运体,其功能涉及临床上许多常用药物和重要的内源性物质在体内的代谢过程。OCT2主要分布在肾小管上皮细胞的
目的探究原发性肝癌(PHC)患者应用多层螺旋CT(MSCT)与血清甲胎蛋白(AFP)、中性粒细胞明胶酶相关脂质运载蛋白(NGAL)联合检测的诊断价值。方法随机选择PHC患者、肝良性占位患
紫外光敏变色织物在紫外线照射下发生变色反应,紫外线消失时恢复到原来颜色。文章通过采用数码测色法探讨了在5种不同紫外光辐照强度下,5种紫外变色织物随着时间变化颜色的响