基于高级语义的通用型文本生成迁移学习

来源 :浙江大学 | 被引量 : 0次 | 上传用户:zhangyili164958807
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然语言处理是人机交互领域的重要核心,是近些年人工智能领域快速发展的方向之一,吸引着研究人员的关注。在深度神经网络被提出后,尤其以序列到序列模型(Seq2Seq)为代表的模型被广泛应用在文本生成任务中,该方向相关的各项任务,如机器翻译、文本等,性能都得到了较大的提高。然而,受限于神经网络数据驱动的特点,相关的自然语言模型只能在构建在规模巨大的语料库上。一旦将已经预训练完毕的模型应用在其他语料,模型的效果会发生明显的削弱。因此,本文对自然语言模型中广泛使用的序列到序列(Seq2Seq)结构进行改进,增加了能够利用迁移学习的功能结构,使其能够利用先验知识或不同任务的预训练模型。相比于原始的Seq2Seq结构,该模型能够利用先验知识和已构建好的预训练模型,即使在小规模数据上也能够达到较好的效果。本文在若干著名的公开数据集和爬虫抓取的网络社区数据集上进行了实验,实验结果表明,本文提出的迁移学习Seq2Seq模型能够很好地利用先验知识以及自然语言任务中学习到的通用知识,在多项指标上均超过了现有的先进算法,实现了迁移学习在不同数据集、不同任务上的普适性。本文所衍生的部分研究被学术界认可并发表了相关的文章至顶会NIPS与IJCAI,在国际竞赛与相关企业实践中都取得了切实的成绩,证明了该研究的学术价值和工业价值。
其他文献
税务行政处罚是税务部门经常性工作,是惩治税收违法行为的重要手段,是实施税法的有效保障,对于维护正常税收秩序具有重要作用。依法治税是税收工作的生命线,规范税务行政处罚
阐述电力载波抄表系统的基本组成及工作原理, 并对该系统的各个基本单元进行简要分析, 介绍为提高该系统可靠性而采取的一些抗干扰措施.
职业教育实践教学场地建设与管理对于职业人才的培养尤为重要,是实践教学不可或缺的基础工作,特别是后期的实践教学场地管理,为接续进行的实践教学提供必要的保障。高职院校
青藏铁路,是一条天路;拉萨则是现代中国人荡涤心灵的地方。心灵的洁静,在某种意义上来自于对肉体极限的超越。人直立于天地之间,有对大地的依恋,也有对天空的渴望。机械设备
函数是高考考查的重点内容,对函数的变形是常见的考查形式近年来绝对值函数频频在试题中出现,主要是因为其基本思想是去绝对值,即将问题转化为熟悉函数的分段形式,而一类一次绝对
"微博问政"是当下少数民族地区政务工作的鲜明特色。本文以云南大理白族自治州政务微博为实证研究样本,通过对其人文地图、传播内容、互动性等分析,探究少数民族地区政务微博
为克服害怕的认识成分,要了解只有当一种情况被觉察时,这种情况才起作用,才会引起害怕的情绪反应。在体操中可以通过理解,教师的说服来减少学生害怕心理的认识成分。至于消除
<正> 1993年11月,辽宁省北票市南八家乡红村下瓦房沟村民发现一座古墓。市文物管理所闻讯后,即派专业人员前往现场进行了调查。墓已被破坏,但据当地村民讲,墓为砖砌圆形单室
<正>当前,在互联网的猛烈冲击下,体量较大、市场化程度较高的都市报首当其冲,用户大量流失、广告收入大幅度下滑、影响力也在削弱,在这种严峻挑战下,都市报唯有以互联网为主
目的评价比较贝伐单抗联合化疗方案FOLFIRI(伊立替康、氟尿嘧啶、亚叶酸钙)和FOLFOX(奥沙利铂、氟尿嘧啶、亚叶酸钙)治疗转移性结直肠癌疗效及安全性。方法回顾性总结我院201