结合无监督元学习方法的神经机器翻译

来源 :信息技术与信息化 | 被引量 : 0次 | 上传用户:stone88822
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
神经机器翻译模型主要是在监督环境下学习模型参数,即编码器将源语言编码为连续的向量表示,解码器从这组连续向量表示中解码出目标语言。对于稀缺资源的语言来说,监督学习方法表现得并不理想。虽然迁移学习方法能够缓解上述问题,但是模型泛化能力较弱,得不到期望的译文。本文受迁移学习启发,提出一种无监督的元学习策略来构建翻译模型,将利用回译方法扩充得到的多语言语料用于元训练,同时采用通用词汇表示方法将多语言词向量映射到共享的向量空间中,实现多语言知识的共享和词向量之间的映射,进而提高翻译质量。此外,本文还设计了一种针对阿
其他文献
为了应对多环芳烃带来的日益严重的环境污染问题,实现对多环芳烃的在线检测,本文结合荧光检测法和微弱信号检测技术给出了多环芳烃在线检测仪器的一种设计方案,可以满足国际
核电厂作为数字化智能电厂,在数字化保护系统的先进性、技术性等方面有着非常严格的要求。在当前信息技术、微电子技术飞速发展的背景下,核电厂的数字化保护,大大提升了运行
威胁情报是广大安全厂商的“兵家必争之地”,威胁情报的引入让各种安全产品如IDPS、ADS、杀软等展现出新的活力,但是目前比较成熟的威胁情报厂商,不论国内国外,其情报质量往
大学阶段书本费用高,但是书本的重复利用率却很低,书本被当作废纸处理,以至于出现了资源浪费问题,为此特设计出漂流书箱——基于C2C模式下的大学生图书共享平台。该平台利用w
本文分析了在“停课不停学”的特殊疫情时期基于“学习通+腾讯课堂”教学平台的线上教学优势,对如何灵活应用教学平台助力《Illustrator软件入门》课程的线上教学进行了研究
针对支持向量机分类器学习新增样本知识实时性差的问题,本文研究了一种基于壳向量和Parzen窗密度估计的雷达辐射源识别在线学习方法。通过Parzen窗密度估计剔除样本孤立野点,
随着现代信息技术的不断进步及普遍应用,国际教育进入了信息化变革时代,本文从国际教育视角,举例说明了信息技术带来的优势,也对未来信息技术在国际教育中的应用与发展,继而
本文运用大数据建模技术,选取塔里木盆地顺北油田生产井相关数据,使用线性回归、随机森林、XGBoost三种方法,利用VSAI大数据分析平台来预测单井井筒压力梯度和温度梯度,并与
本文介绍了离线地图的基本下载原理、分级下载技术、存储原理及数据服务的本地化部署技术,通过地震勘探处理业务中SPS文件格式构建了炮点检波点数据库,并在离线地图上进行了
近些年来我国已经逐渐迎来了大数据时代,其在各行各业中的应用已经取得了良好的成果,尤其是对于企业安全生产预警系统来说,有必要展开深入研究。本文简略阐述了大数据以及企