基于异构图和多关键词对交互矩阵的句子相似度计算方法研究

来源 :西北大学 | 被引量 : 0次 | 上传用户:djgohx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
句子相似度计算是自然语言处理中广泛应用的技术,是句子语义理解的基础,能促进计算机对人类语言的深入理解。为了能准确地对句子进行相似度计算,本文首先提出一种能准确地对句子语义建模的句子表示方法,然后提出一种能高效地对句子之间的语义关系建模的句子匹配算法,最后在此基础上提出一种句子相似度计算方法。本文主要研究工作如下:(1)针对句子包含的空间信息的特征很难被准确提取的问题,提出了一种基于异构图的句子表示方法(Heterogeneous Graph-based Sentence Representation,HG-SR)。该方法首先基于句法依存树和上下文滑动窗口构建出句子的异构图,从而表达出句子丰富的空间信息。其次使用Bi LSTM来提取句子的时间特征,使用GCN来提取句子的空间特征,使用CNN来提取句子的句法关系特征。最终将这三种特征合在一起作为句子的向量表示。实验结果表明本文提出的句子表示方法优于大多数现存的句子表示方法。(2)针对句子中包含的冗余和噪声会影响句子匹配算法性能的问题,提出一种基于多关键词对的句子匹配(Multi Keyword-Pair based-sentence Matching,MKPM)算法。该方法首先设计一种基于句子对的注意力机制(Sentence Pair based Attention,SPAttention)来从两个句子中抽取多组关键词对,避免了句子中的冗余和噪声的干扰。其次通过双任务架构来对这些关键词对进行语义关系建模,从而完成句子对匹配。实验结果表明,该模型可以在多个句子匹配任务中达到最先进的性能。(3)针对少量的相似度度量特征和单一的度量方式会导致相似度计算准确率低下的问题,提出了一种基于相似度交互矩阵的句子相似度计算方法(Similarity Interaction Matrix-base Sentence Similarity calculation,SIM-SS)。该方法首先使用多种相似度度量方式来对两个句子的特征向量进行交互从而构建出SIM。其次使用神经网络技术对SIM进行深层语义特征的提取,从而更准确的计算相似度。最终将前两个研究与该研究结合,得到一种高性能的句子相似度计算模型,实验结果表明该模型具有最先进的性能。
其他文献
随着信息技术的飞速发展,传统产业和新兴互联网经济的深度融合过程中产生了海量数据。存储技术及计算技术的发展,直接推动了大数据产业的发展壮大。数据量的急剧增长,催生了云计算和数据中心在全球范围内的普及。连接远程数据中心之间的骨干网上的数据传输任务十分繁重。云运营商用昂贵的高带宽链路为各种用户提供大数据传输服务。如何通过提供高质量的服务来赚取可观的利润是运营商所关注的核心问题。科学合理的定价机制是保障运
为掌控在线舆情及国际局势走势,政府机关、应急管理部门等现实世界的合法机构与组织需隐蔽地收集并分析来自国内外新闻媒体、特定网站以及热门在线社交平台的数据,避免被相关人士追根溯源。反溯源的本质在于通过特定技术隐藏信息浏览轨迹和搜索意图,防止网站来访者被溯源跟踪。构建安全的受控入网环境系统,提供一个安全的、受控的、反IP追踪的安全互联网入网环境,实现反溯源。溯源的主要手段为重构来访者的访问路径,因此,构
在《新一代人工智能的发展规划》和《教育信息化“十三五规划”》的推动下,人工智能、云计算、大数据、物联网、计算机视觉等信息技术深入推动教育信息化改革,学生课堂行为识别分析成为教育研究的重点。针对目前研究中缺少相应的大规模视频数据集,识别容易受到性别、体型、复杂场景和相似动作等因素干扰的问题,本文做出以下贡献:本文选取骨架信息减少受遮挡的影响,对比选出适用于课堂场景的姿态估计算法,同时提出多维特征融合
航拍图像指使用航拍飞行器携带摄影设备,在空中对地面物体进行拍摄,从而得到的航拍目标信息,被广泛应用在地貌测绘、军事侦察等众多重要领域内。因此航拍图像的清晰度研究有着十分重要的现实意义。本文分别从依赖图像退化模型的传统算法和依赖神经网络模型的深度算法两个方面,对航拍图像中广泛存在的运动模糊问题展开研究。传统算法研究过程中:首先,结合航拍成像特点进行理论分析,估算航拍运动模糊核的像移长度和像移角度两个
计算关联成像作为一种新型的成像方式,具有传统成像不具备的抗干扰性强的特点,近年来在水下成像、遥感成像中发挥着其独特的作用。在散射介质下的计算关联成像中,如水下计算关联成像,测量矩阵对成像效率和成像结果的质量都至关重要。本文围绕存在散射介质的不同测量矩阵计算关联成像进行了研究,主要工作内容如下:1.通过比较散射介质中计算关联成像应用的不同的测量矩阵,研究了应用不同测量矩阵的成像速度和成像质量。通过选
三维点云配准是寻找两个或多个三维点云之间的最优空间变换关系,使其能够在空间中达到良好的匹配,它是计算机视觉、模式识别和智能机器人等领域的关键技术之一,具有重要的理论研究意义和实际应用价值。三维点云配准主要分为刚体配准和非刚体配准两大类,对于包含噪声、外点及数据缺失的点云非刚体配准算法研究仍是当前点云配准领域的一个热点和难点问题。针对包含噪声、外点及数据缺失的三维点云非刚体配准,本文在深入研究传统迭
视频超分辨率重建是一种根据低分辨率视频恢复高分辨率视频的技术。视频超分辨率技术是计算机视觉领域中的经典和热点研究内容之一。视频超分辨率重建旨在利用视频帧序列的时空相关性生成精度高,且感知质量好的高分辨率视频。本论文重点围绕基于深度学习方法提高视频的感知质量问题展开研究。在深入研究先进的基于深度学习的视频超分辨率方法的基础上,提出了一个新的光流补偿结合多特征鉴别生成对抗网络OFC-MFGAN,并将其
近年来,深度卷积神经网络(Deep Convolution Neural Networks,DCNN)在单幅图像超分辨率(Single Image Super-Resolution,SISR)中得到了广泛的应用。然而,大多数现有的基于DCNN的SISR方法往往会产生过于平滑的输出,对图像细节信息的恢复不够理想。为了解决上述问题,本文对基于小波变换和自注意力机制的图像超分辨率重建算法进行了相关研究,
在网络媒体时代,人们通过微博、短视频等社交平台对各类热点事件发表相关言论和看法,这些文本内容简短、表达幽默,能充分反映人们的内心情绪。挖掘这些短文本的潜在情感倾向性,分析和预测用户行为,可以为各个领域的舆情监管工作提供辅助支持。目前,面向网络短文本的情感分析算法研究已取得了一定的成果,但仍存在一些问题,例如,网络新词的不断涌现造成分词效果较差;短文本表现形式的复杂导致传统特征选择结果不佳;特征学习
MOOC平台课程评论文本中包含了大量学习者对某一门课程的看法,甚至是对授课教师和学习平台的看法。然而海量的评论数据使得教师或平台无法对每条评论及时阅读和处理。通过对MOOC课程评论进行情感分类和方面挖掘研究,能够了解学习者在学习过程中所关注的方面和对其产生的情感态度,有助于教师或平台改进教学方式和完善平台功能,从而调动学习者积极性,降低退课率。本文以MOOC课程评论文本为研究对象,针对情感分类和方