【摘 要】
:
低资源型的汉越神经机器翻译中,数据稀疏问题是影响翻译性能的主要原因,目前缓解该问题的途径之一是通过语料扩充方法生成伪平行数据,并用于机器翻译模型的训练,伪平行数据生
【机 构】
:
昆明理工大学信息工程与自动化学院,昆明理工大学云南省人工智能重点实验室
【基金项目】
:
国家重点研发计划(2019QY1801),国家自然科学基金(61672271,61732005,61761026,61762056,61866020),云南省高新技术产业专项(201606)
论文部分内容阅读
低资源型的汉越神经机器翻译中,数据稀疏问题是影响翻译性能的主要原因,目前缓解该问题的途径之一是通过语料扩充方法生成伪平行数据,并用于机器翻译模型的训练,伪平行数据生成方法主要有基于词的替换、单语数据回译和枢轴翻译3种。目前的研究集中于3种方法的单独使用,缺少方法间融合利用方面的研究工作,针对此问题,提出了融入双语词典的正反向枢轴方法,利用英语作为枢轴语言,在汉到英到越正向枢轴的基础上,融入利用稀有词构建的汉-英和英-越双语词典,将汉语单语数据通过模型翻译成英语数据,再利用英-越模型将其翻译成越南语数据,其
其他文献
【正】 1993年全省林产工业和多种经营销售收入达到5.48亿元,利税5670万元,分别比1992年增长110.7%和102.4%,对增强林业单位的经济实力,促进林业的全面发展,起到了积极的推动作
目的:探讨细节性护理对食管癌根治术后患者排痰效能及应对方式的影响。方法:将200例食管癌根治术患者随机分为对照组和干预组各100例,对照组给予常规护理,干预组在此基础上给
一、电子文件的特点 所谓电子文件,是指只能由计算机处理的文件,也叫机读文件或自动化数据处理文件,其所载信息适合于用数字计算机进行检索、加工、交流,电子文件与纸质文件
本文在带平衡尾绳的动态提升系统的基础上,利用拉格朗日方程式建立了系统的运动方程式,以及对系统的弹性力学计算和对提升钢丝绳的动态安全系数的设计.本文可以作为理论研究
对ZQ型渐开线圆柱齿轮减速机漏油的原因进行分析,并有针对性地进行了有效处理.
依据实测数据提出发热量与工业分析、元素分析、硫间定量关系式;探讨焦油产率、着火点与工业分析、发热量、元素分析间的定量关系。
【正】 泌阳县经过多年的探索试验,创造了发展高效薪炭林“材薪经营型”的造林模式。实践证明,这种模式能更好地起到保持水土的作用,病虫害、火灾不易发生,单位面积内生物产
将煤灰连续加热到1600℃,测定其收缩变化,并对其机理进行了研究。确认了快速收缩时的温度与相图中共熔物形成温度的一致。试验将样品加热到这一温度,迅速冷却,然后用扫描电镜(SEM)
Nowadays,with the increasing operational life of ships,the aging effects on their structural behavior need to be investigated precisely.With the corrosive marin