基于深度学习的智能聊天机器人的研究

来源 :浙江理工大学 | 被引量 : 0次 | 上传用户:wxgaihxx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习在自然语言理解、词向量表示、机器翻译、情感分析以及中文分词领域的应用,人们开始研究聊天机器人的关键技术,把深度学习应用于聊天机器人。近年来,聊天机器人成为了一个非常热的人工智能的研发方向。目前研究者们在研究开发开放领域的聊天机器人时,一般会在深度学习技术的Sequence to Sequence(或者称作是Encoder-Decoder)框架下进行改进的。本文也是在这样的技术原理下,针对聊天机器人研究领域出现的一些主要问题进行了分析研究,提出了一个新的聊天机器人模型,即神经网络主题模型与深度学习语言模型相结合得到的智能聊天机器人模型(T-DLL Model)。本文设计的神经网络主题模型是将传统的主题模型LDA与长期记忆网络结合形成新的LSTM-LDA神经网络主题模型,深度学习语言模型的设计是基于Attention Model的双向LSTM(Bi-LSTM)的Encoder-Decoder框架模型。具体研究工作如下:(1)针对词向量的训练问题,采用了word2vec训练工具,通过distributed representation的方式来表示词,而且根据word embedding机制“降维”的原理来减少计算量。(2)针对长距离依赖问题,配合使用了Attention model(注意力模型)和Bi-LTSM(外部记忆单元)。其中Attention model解决了传统Encoder-Decoder框架只有一个中间语义向量从而导致信息丢失、信息冗余的问题。LSTM模型通过学习长期依赖信息,解决了循环神经网络(RNN)的Gradient Vanish(梯度消失)问题和模型训练中的长期依赖问题。Bi-LSTM模型解决了LSTM模型没有考虑到下文的信息,丢失了部分的语义信息的问题。(3)为了解决万能回复的问题,使机器人能够生成持续的、有意义的对话,本文提出使用向量空间方法来计算输入问句经过word Embedding生成的词向量与通过神经网络主题模型获取语料库中和问句相似的可作为主题信息的语义向量的相似度,根据相似度值进行叠加或者替换当前主题信息,获取新的当前主题信息,然后将当前主题信息与Encoder输出的上下文语义信息相结合作为Decoder的输入。带有主题信息的聊天模型能够在理解上下文的基础上,解决因多轮会话中生成无意义对话而导致对话难以进行下去的问题。通过抓取字幕库网站得到的语料库对本文提出的模型进行训练,运用深度学习的编码库来实现模型,结果表明本文提出的模型在进行持续有意义的对话上比传统的语言模型要好些。
其他文献
目的了解血液透析(HD)患者透析前后体液的分布状况及其对血压的影响。方法106例健康志愿者作为正常对照,按性别分为组用生物电阻抗频谱法检测并计算细胞外2,液(ECV)、细胞内
2007亚洲信息及通信技术展览会(亚洲CeBIT)将于10月10~15日在上海新国际博览中心举行。本次展会分为电脑及其周边配件、机器人技术、企业及制连业信息化,电子金融及安全以及通信
为全面贯彻落实《国务院办公厅关于印发职业技能提升行动方案(2019-2021年)的通知》等文件精神,推动实施职业技能提升行动,人社部办公厅、财政部办公厅印发《关于做好职业技
本文在梳理资本充足性、资产质量、流动性等监管因素影响银行同业资产发展的理论基础上,对我国15家上市银行2010—2015年的相关数据进行了实证分析。实证结果表明:资本越充足
逢年过节,走亲访友,久别欢聚,庆贺壮行……酒,似乎成为人们生活中不可缺少的东西。诚然,少量饮酒能促进血液循环、有益健康,有些场合酒也能调节氛围、使人兴奋。但我们说,饮
杨得志、杨成武、扬勇是人民解放军开国将帅群体中杰出的代表。1955年均被授予上将军衔。“三杨”在建国后都曾较长时期在解放军总参谋部任职,其中杨得志担任了七年多总参谋长
目的了解近年国内中药不良反应的情况和报告现状。方法通过CNKD数据文献检索,归纳、分析文献报道中各医疗机构或地区的中药ADR数据。结果中药ADR发生率在总ADR中占一定比例,
随着经济的迅速发展,东莞市某镇外来务工人员逐年增多,其子女的教育问题也日益凸现出来.尽管当地政府对非户籍适龄儿童的教育政策比较宽松,但是,与户籍儿童相比,非户籍适龄儿
目的:为系统梳理山东潍坊某街道“全民艾灸项目”的实施模式,评价其实施效果,开展本调查。方法:选择与艾灸街道相似的未实施艾灸的同区另一街道作为对照,采用现况研究抽样调
目的 建立测定人血浆中醋氯芬酸浓度的高效液相色谱法。方法取血浆500μL酸化后用乙酸乙酯一步提取,40℃水浴氮气吹干,流动相复溶后进样测定。采用HypersilC18柱(250mm×4.6m