神经网络序列生成模型的研究

来源 :北京邮电大学 | 被引量 : 2次 | 上传用户:netchina123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习的发展以及各项自然语言处理技术的提高,神经网络序列生成模型已经成为了研究热点并得到了广泛的应用,比如机器翻译,自动文本摘要,自动生成字幕等。近几年,序列生成模型已不局限于自然语言处理任务,也逐渐被引入推荐领域。本文对现有的神经网络序列生成模型进行了调研和分析,并分别对文本序列生成和行为序列生成中存在的几个问题展开研究和改进。本文的工作可以总结为以下两个部分:1、设计并实现了序列生成模型训练的曝光偏差正则训练框架。本文分析了主流神经网络序列生成模型存在的训练和测试阶段输入分布不一致的问题,提出引入曝光偏差正则项使模型在测试阶段具备更强的泛化能力。同时,为了加快模型的收敛,又提出寄生学习和课程学习两种辅助训练方式辅助模型在曝光偏差正则训练框架下更好地完成训练。2、设计并实现了基于时间窗的批处理训练方式和时间敏感循环神经网络用于提高行为序列生成模型的训练效率和效果。行为序列不同于文本序列,具有序列长度方差大和时间间隔不等距的特点。本文为了适应行为序列的特点对序列生成模型提出相应的改进。改进主要有两点:一是针对行为序列长度方差大的问题,提出基于时间窗的批处理训练方式提高模型的训练效率;二是针对行为序列时间间隔不均匀的问题,提出时间敏感循环神经网络,利用时间间隔信息对用户的长短期兴趣进行更好地平衡。最终将序列生成模型应用于推荐系统中的用户行为序列建模,作为召回模型。
其他文献
目的:探讨辅助化疗对胃肠道恶性肿瘤术后的患者血糖水平、胰岛功能的影响。方法:入组病例来源:2015年05月-2016年02月在青海大学附属医院胃肠外科确诊的胃肠道恶性肿瘤患者53
以"美国国家选举研究中心"发布的总统选举调查数据为样本,分析美国选举政治中政治参与的方式和程度,以及媒介接触、政治效能感与政治参与三者间的联系,探究现代社会中传统媒
目的:该研究将AML细胞与骨髓间充质细胞MSC共培养,建立共培养体系;并观察MSC与AML细胞共培养对AML细胞凋亡和CXCR4表达的影响;并通过CXCR4拮抗剂沉默CXCR4的表达后,观察其对
目的:1.体外观察哇巴因对T淋巴细胞白血病Jurkat细胞株的凋亡、hTERT、c-myc mRNA及蛋白表达的影响,探讨哇巴因的抗肿瘤作用机制。2.探讨相同浓度哇巴因对正常人BM-MNCs的影
北京市某区于1984年8月在学龄儿童中暴发一次急性咽结合膜热,累及数千人,80%以上患儿有游泳史。从10例住院患儿的20份标本(10份咽拭子和10份眼结膜拭子)中分离出14株腺病毒,咽
<正>员工离职是一种较为常见的人才流动现象,有些是由于找到了更加心仪的工作而自愿辞职的,有些是因严重违反了单位的规章制度而被解雇的,还有一些则是劳动合同期满没有续签
慢性阻塞性肺病(COPD)的发病率在全球范围内不断上升.与艾滋病一起被列为第4大死亡病因,对COPD的康复治疗的研究具有非常重要的意义,现就目前COPD的治疗方法和进展做一综述。
介绍了单缸直推式和双缸水平交叉推压式垃圾压缩机的结构型式,讨论了双缸水平交叉推压式压缩机的工作原理、参数选择以及油缸的有关计算和校核,并对压缩机的优化设计提出了设计
中煤平朔集团有限公司井工一矿是我国露井联采技术应用到实际的首座大型现代化矿井.自2005年投产以来.坚持“先行先试、敢闯敢试”。持之以恒致力于自动化、信息化方面的探索与
《夏洛的网》的作者是E.B.怀特,他是一位在文学领域颇有造诣的幽默作家、散文家和讽刺作家。这部作品是怀特先生较为著名的儿童文学作品。作者怀特采用一贯的讽刺手法,借助"