基于神经网络的短文本语义相似度计算方法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户：slovedw520

【摘要】

：

【作者】

：

杨晨

【出处】

：

电子科技大学

【发表日期】

：

2020年07期

【关键词】

：

神经网络注意力机制 BERT模型文本语义相似度

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着信息时代的到来,大量的文本信息数据呈现爆炸式的增长。如何从大量的文本数据中提取有效信息成为当前研究的重要任务。而短文本语义相似度计算作为自然语言处理的关键技术被广泛的应用在文本信息检索和智能问答系统等领域。短文本语义相似度计算指的是给定两个短文本序列然后计算它们之间的语义相似度。目前关于短文本语义相似度的研究大致可以分为两种:第一种是基于传统的统计学的方法,比如向量空间模型等;第二种是基于神经网络的方法,比如DSSM模型或者预训练模型BERT模型等。BERT模型通过在大规模语料上进行语言模型的训练,学习单词的通用表征能力,在各种自然语言处理任务上都取得了很好的效果。本文针对BERT模型做了深入的研究,认为BERT模型虽然强大,但是在短文本语义相似度问题上还存在一些缺点,比如忽视了其他位置的上下文信息。本文在调研近年来短文本语义相似度算法的基础上,对短文本级别的语义相似度算法进行研究,提出了对BERT模型全部上下文信息进行聚合来计算短文本语义相似度的网络结构。本文首先提出了基于多种注意力机制-LSTM聚合网络的BERT微调模型。该模型通过BERT模型将该文本序列进行编码,再采用多种注意力函数计算交互信息。最后将通过多种注意力机制和LSTM网络聚合得到的文本相似度向量和[CLS]位置的编码信息进行融合。该方法用不同的注意力机制提取了其他位置的相关信息,因此在三个标准数据集上的效果都超过了BERT模型。同时在所有改进的BERT微调模型中,该模型取得了目前最优的结果。另外,本文也进行了多种注意力机制的分解实验,同时分析了不同注意力函数对最终预测结果的影响。实验结果表明各种注意力函数对模型都有重要影响,但是不同的注意力函数对结果的影响不同。本文又提出了基于MatchPyramid结构的BERT微调模型。该模型改进了传统的用卷积神经网络对BERT模型进行扩展的方法。同样的,先将文本序列对拼接成一个文本序列,然后通过BERT模型将该文本序列进行编码。区别于用一维卷积网络直接对文本编码序列进行卷积,该模型将不同句子的单词编码向量进行两两匹配,再用二维卷积和池化操作对匹配信息进行信息抽取。最后将信息抽取结果和[CLS]位置的编码信息进行融合,计算文本语义相似度。该方法用卷积网络对特征匹配矩阵进行处理,考虑到了文本间单词的匹配信息,因此在释义识别和自然语言推理任务上效果都超过了传统的用卷积神经网络改进BERT的方法。

其他文献

用于污染物降解的多级连续流电化学反应器研究

工业废水中含有大量高毒性、难降解有机物,若未经处理直接排放,将对人类健康和环境安全造成极大的威胁。随着社会的发展,工业废水的排放量逐年增加,而排放标准日趋严格,现有

学位

多级电化学反应器废水处理模拟废水印染废水能耗电流效率数学模型

高校学生资助体系的思想政治教育功能及其实现研究

大学生是十分宝贵的人才资源,承担着实现中华民族伟大复兴的历史使命。加强和改进大学生思想政治教育,关系到高校“培养什么样的人、如何培养人以及为谁培养人”的根本问题。高校学生资助体系作为高校思想政治工作质量提升工程的重要内容和有效载体,是思想政治教育“既要教育人、引导人,又要关心人、帮助人”的深刻体现。因此,开展高校学生资助体系思想政治教育功能的研究,挖掘其中丰富的思想政治教育资源,实现资助育人,是新

学位

高校学生资助体系思想政治教育功能资助育人精准育人

高原环境对柴油机起动过程影响分析

从柴油机在高原地区冷起动困难的实际情况出发，分析了影响柴油机顺利起动的三个因素，研究了高原环境对柴油机起动过程的影响机理，并介绍了适用于高原地区的柴油机起动辅助措施。

期刊

高原环境起动过程起动辅助措施

鲜食糯玉米农艺性状与鲜穗产量的分析

本文以参加国家黄淮区域试验的19个糯玉米品种为材料,分析了糯玉米的11个农艺性状与鲜穗产量表现。结果表明,参加区试的糯玉米品种,鲜穗产量最高的是西星白糯2号,其次是郑彩

期刊

糯玉米鲜穗产量农艺性状分析

SWELL1对心肌梗死后心脏间质纤维化的调节作用及其分子机制

研究背景:心脏间质纤维化是心肌梗死(MI)后病理性心脏重构的特征性病变,也是MI后心力衰竭发生的关键机制之一。然而,MI后心脏间质纤维化的细胞与分子机制尚未阐明,临床上也缺

学位

SWELL1心脏成纤维细胞JAK2-STAT3信号通路心脏间质纤维化心肌梗死

基于业务流程的信息资产识别及其价值确定

对GB/T20984-2007中定义的5种资产之间的关系进行分类分析,提出数据和服务资产是需要保护的核心资产,硬件、软件、人员资产是数据和服务资产的支撑资产;通过对支撑组织业务运

期刊

业务流程资产识别资产价值位置固定资产位置变动资产

中医药治疗风热感冒用药规律分析

[目的]探讨中医药治疗风热感冒用药规律。[方法]通过对国家专利网搜索,筛选出关于治疗风热感冒的中成药及中药方剂组方共有164首,并录入中医传承辅助系统(V2.5),采用软件集成

期刊

中医药风热感冒用药规律

鸡胡须性状的基因定位及功能研究

农业动物经历了上千年的自然选择和人工选择,积累了大量的表型变异。农业动物表型和遗传的多样性为我们提供了极好的研究模型,改善了我们对于动物发育和疾病发生等过程中基因

学位

胡须基因定位结构变异拷贝数变异HOXB8

责任式创新:“内涵-理论-方法”的整合框架

科技创新的负面影响与新兴技术的治理挑战引发研究与政策对"责任式创新"的关注。本文以文献研究为基础,通过责任式创新主题文献的系统回顾,构建"内涵-理论-方法"的整合框架,

期刊

责任式创新共性理论科技治理“内涵-理论-方法”框架

2018~2019赛季CBA季后赛半决赛球队进攻速度的研究与分析

本文运用文献资料法、录像观察法、数理统计法以及逻辑分析法等研究方法,结合篮球比赛中进攻速度与进攻的成功率,对2018-2019CBA季后赛半决赛比赛各球队的全场进攻速度、阵地

学位

CBA2018-2019赛季季后赛半决赛进攻速度进攻成功率

基于神经网络的短文本语义相似度计算方法研究

与本文相关的学术论文