基于seq2seq模型的聊天机器人对话研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:h725bin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习研究不断取得突破,深度学习技术更加广泛地应用在自然语言理解、词向量技术、中文分词、情感分析等领域。相比基于检索技术的聊天机器人,基于深度学习的聊天机器人扩展性更强,系统开发效率也更高,有着非常广阔的发展前景。目前seq2seq模型是最常用于开放领域聊天机器人的深度学习模型,但传统seq2seq模型直接应用于聊天机器人会有一些问题,如长距离依赖问题、安全回复问题等。针对传统seq2seq模型存在的问题,本文提出了一个聊天机器人对话模型,即注意力机制、集束搜索算法、BiLSTM与传统seq2seq模型相结合得到的聊天机器人对话模型。具体的研究工作如下:(1)本文研究了词嵌入相关技术。传统的文本表示方法,无法表现出单词之间的语义相似性,且当词典数量极大时,会出现向量维度大的问题。word2vec通过将语义相近的词映射到向量空间中相近的位置,使得词向量带有语义信息,并通过“降维”降低运算量。(2)本文详细分析了传统seq2seq模型的长距离依赖问题,提出了使用BiLSTM和注意力机制。传统seq2seq模型使用的LSTM无法编码从后到前的信息,BiLSTM可以更好地捕捉双向的语义依赖,解决了丢失部分语义信息的问题。传统seq2seq模型在编码和解码时都只使用一个固定长度向量,注意力机制通过保留编码器输入序列的中间输出结果,利用训练模型对这些输入进行选择性的学习,并且在模型输出时将输出序列与之进行关联,从而解决了长文本序列信息丢失的问题。(3)本文研究了传统seq2seq模型的安全回复问题。传统seq2seq模型中解码器的输出原则是直接输出候选结果集中概率最大的语句,但概率最大的语句往往是语料库中最常见的语句,如“我不知道”、“你好”等安全回复。本文采用了集束搜索算法,通过排序和剪枝使本文的聊天机器人对话模型比传统seq2seq模型生成的回复更多样,很好地改善了安全回复问题。使用TensorFlow框架实现本文提出的聊天机器人对话模型,并使用中文对白对本文提出的聊天机器人对话模型进行训练。通过最后的实验效果对比,验证了本文提出的聊天机器人对话模型是有效和可行的。
其他文献
实验教学时物理教学的重要组成部分,其教学有效性的高低直接影响着物理教学目标的实现。为此,本文电磁学实验教学为例,从实验器材的选取、实验过程的规划、实验教学方法的创
以粳稻 95 16为材料 ,对上海地区直播单季水稻物质生产特点进行了分析研究。结果表明 :(1)生物产量与经济产量相关密切 ,抽穗前干物质生产量与谷物产量呈二次曲线相关 ,抽穗
汽轮发电机组一次调频能力不稳定的现象较为普遍,严重地影响到电网运行的安全。结合华东电网的具体案例,分析指出造成机组一次调频能力不稳定的根本原因是汽轮机局部转速不等
目的:探讨骨化三醇冲击和每日治疗终末期肾脏病(ESRD)并发性甲状旁腺功能亢进(SHPT)患者的疗效。方法:将50例并发SHPT的ESRD患者随机分为两组,常规组每日给予骨化三醇胶丸(0.25μg/d
本文从数字电视技术标准的意义谈起,分别回顾了美国ATSC标准、欧洲DVB标准、日本ISDB标准的制定和发展,以及我国数字广播电视标准化工作的现状,介绍了数字电视地面系统标准及其
随着能源需求的不断增涨,以及人们环保意识的不断增强,绿色、环保、安全、可持续能源越来越成为人们关注的焦点。氢能凭借着其独有的特点,被誉为“二十一世纪”的能源,许多国家都
地方院校的转型发展为图书馆的文献资源建设带来了机遇,图书馆要根据学校的建设方向、重点和读者的需求,建设有重点、有特色的文献资源库和优化自己的馆藏结构,从而为学校的转型
在分析催化裂化汽油硫和烯烃分布不均匀的基础上,对催化裂化汽油进行轻、重组分分馏,开发了活性高和稳定性好的重馏分辛烷值恢复催化剂及FCC汽油加氢脱硫降烯烃DSRA技术。采用D
【活动理念】本设计依据《中小学心理健康教育指导纲要》中“帮助学生确立正确的自我意识,树立人生理想和信念,形成正确的世界观、人生观和价值观”的内容要求设计。
Kishner-wolff反应(简称K-W反应)是1911—1912年发现的,它是还原醛和酮的腙或缩氨脲为烃的著名方法。黄鸣龙、Cram、Grundon等人曾研究过此反应。1979年,我们用冠醚作相转移