基于深度学习的文本相似度算法的研究与应用

来源 :重庆大学 | 被引量 : 0次 | 上传用户:alexiss
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网行业和深度学习技术的快速发展,自然语言处理领域取得了前所未有的进展。自然语言推理在大数据的背景下取得了丰硕的成果,文本相似度分析是自然语言推理中一项基本而又关键的任务,并在很多自然语言处理任务中起着不可替代的作用,比如:信息检索、自动问答、机器翻译、自动摘要和智能客服。提高中文文本相似度计算准确性,可以基本解决很多自然语言处理领域中文本相关的问题,因此为了提高文本相似度算法的准确率,本文做了大量的相关工作和研究。本文主要研究基于深度学习的中文文本相似度算法,分别训练以词向量和字向量为输入的中文文本相似度模型,并分析不同粒度的输入对模型的影响。本文分析了传统的孪生LSTM模型的缺点,并对模型进行改进,在模型中引入双向LSTM,充分利用双向LSTM每个时间步的信息,达到捕获文本多维度语义信息的效果,并在模型中引入注意力机制,使句子编码所包含的语义信息更加丰富。为了解决一词多义的问题,更好的获取句子的语义编码,本文利用迁移学习技术,将Bert模型引入到文本相似度计算中,并在其基础上结合卷积神经网络来学习句子的深度文本表示,设计并实现了基于Bert的表征模型,并取得了非常好的效果。本文还实现了两个基于交互的文本相似度模型,并将其与本文训练的其他模型进行融合。本文通过多模型融合方法达到进一步提高中文文本相似度计算准确性的目的。本文设计并实现基于FAQ的智能客服系统,将本文实现的中文文本语义相似度模型应用到系统中,系统主要涉及文本预处理和深度融合模型等关键技术。智能客服系统主要是自动回复用户提出的受限领域相关问题。通过对系统的测试,系统自动回复有很高的准确率,这也进一步说明了本文实现的深度学习模型和文本相似度融合模型的有效性。
其他文献
研究目的:视网膜色素上皮细胞功能障碍能够导致光感受器变性和视力丧失,并与人类常见的致盲性疾病相关,如年龄相关性黄斑变性(Age-related macular degeneration,AMD)等。Mic
根据企业发展的中心任务,适时调整班组建设的重点和切入点,才能对企业的安全生产起到助推作用。这样因时而变、因事而变、因势而变的做法,使得班组建设不落窠臼,更具针对性、实用
报纸
通过对研究生创业教育的现状分析,从学校、学生和社会的层面揭示了创业教育.的影响因素,并以高校的角度从树立创业教育理念、优化创业教育环境、构建课程体系、实施创业实践活动
在53只家兔进行了实验观察用玻璃微电极在杏仁核A0~2 L3~5 H-2~-7范围内记录神经元单位放电,以电刺激腓神经及有齿镊夹耳壳为伤害性刺激,共观察461个杏仁核单位放电,其中痛单位216
我们应用Balb/c小鼠,电针双侧“承扶”穴30分钟,以观察电针调节免疫反应听阿片肽机制。发现在电针处理3小时后,脾淋巴细胞对ConA刺激的增殖反应和白细胞介素-2(IL-2)的产生均明显增强。这种增强作用可
本文根据江苏省三麦气象研究协作组九个试验点1982—1983、1983—1984两个年度的田间试验资料,在建立叶龄和有效积温模式的基础上得出冬小麦济南13号和扬麦4号每生长一片叶片
期刊
陶行知先生说:"没有生活做中心的教育是死的教育,没有生活做中心的学校是死的学校,没有生活做中心的书本是死的书本。"应将幼儿的美术教育与生活相结合,文章从研究生活,幼儿园美
如何让绘画活动更加有趣,使简单的线条,多变的色彩,为孩子们插上想象的翅膀,而展现出一个丰富神奇的童心世界。本文从幼儿艺术教育的视角分析、探讨了发展幼儿绘画能力的方法