基于图注意力网络的短文本分类研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:houzi7731
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能设备的普及应用,日常生活中产生了大量的碎片化短文本信息,例如,手机短信,社交动态分享,搜索语句,商品评论等。为了从这些海量的短文本信息中挖掘到更多的潜在商业价值,短文本分类任务受到越来越多的关注。由于短文本数据的独特属性,使其相较于长文本分类更加困难。一方面,短文本一般短小简洁,语法不规范,导致其特征稀疏,信息匮乏;另一方面,短文本更新速度快,数据量大,但是缺乏大量的带标签数据用于训练。
  针对短文本分类任务,通过分析不同分类算法的优缺点,提出了一种基于图注意力网络的短文本分类算法,其主要内容包括:
  (1)提出一种共现信息模型(Co-occurrence Information Model,CIM)用于构建短文本数据集的图结构,从而通过图结构的信息补充,能有效缓解短文本数据的稀疏性。首先,对语料库中的短文本进行分词,然后将词语和短文本视为图中的节点,并利用共现信息,构建词-词、词-文本、文本-文本之间的边。其中,共现信息基于PMI,TF-IDF,Cosine相似度等统计指标得到。
  (2)在构建的图数据上应用图神经网络分类模型对图中短文本节点进行分类。具体地,首先以图卷积网络(Graph Convolutional Networks,GCN)为基础模型搭建CIM-GCN模型,并从原理分析其优缺点;随后,在图中引入Attention机制,改进图注意力网络(Graph Attention Networks,GAT),从而得到CIM-GAT模型;进一步地,为了从不同特征子空间进行注意力特征提取和融合,参考多头注意力(Multi-Head Attention)的思想,提出CIM-MGATs模型。
  (3)为了克服缺少训练数据的困难,构建基于图的半监督学习方法。首先利用有标签数据和无标签数据共同建图,从而丰富图结构信息,然后再对整个图建模,使得标签信息和数据特征在图结构中利用拓扑结构进行有效传播,最后得到图中所有节点的最终表示和预测结果。
  最后分别在HR,MR等短文本分类数据集进行实验,发现基于图注意力网络的CIM-GAT和CIM-MGATs模型相较于其他基础模型,不仅分类准确率更高,而且,对训练数据规模的鲁棒性更好。
其他文献
从自然场景图像中读取文本由于其广泛的应用而受到了计算机视觉领域、模式识别领域以及工业界的广泛关注。在如今的智能大数据时代,能够有效地对图像文本内容进行提取分析并信息智能化对于学术界的理论研究和工业界的技术驱动都具有深远意义,而图像文本检测是后续文本内容识别的先决条件,但由于场景图像因光照、拍摄角度、背景和文本多样性等诸多问题,目前还鲜有能适用于复杂场景图像文本检测的技术手段,因此,提高对复杂场景文
人脸三维建模是一项发展已久的计算机技术,目前已广泛用于医疗、游戏和影视娱乐等领域。传统获得三维人脸的方法成本较高、过程复杂,在一定程度上限制了三维人脸的应用场景。而随着计算机视觉技术的进一步发展,从二维图像中进行三维人脸重建的技术逐渐成型,该方法前置条件简单,容易实现全自动化。但该方法重建的三维模型目前还存在几何形状不够精确、纹理贴图效果易受光照影响等问题,尚有较大的提升空间。  对三维人脸重建过
学位
前列腺癌是一种发生于男性前列腺的恶性肿瘤。临床上主要使用磁共振(MR)成像来对前列腺癌进行诊断。传统的人工阅片方法耗时长,且易受主观因素影响。计算机辅助诊断系统可有效提高医生诊断的效率和准确率。但是由于前列腺癌病灶具有体积小、轮廓模糊等特点,使用MR图像进行前列腺癌自动检测非常具有挑战性。  建立可用于深度学习的前列腺癌数据集非常困难,因此数据集中的训练样本较少。为了充分利用有限的数据,本文设计了
学位
在临床诊断过程中,提取脑部中矢状面具有非常重要的意义,通过中矢状面计算头部偏角,从而摆正图像中头部的位置,可以为诊断脑部疾病提供最佳观察视角;根据中矢状面计算大脑左右半球的对称性,也能为判断某些脑部疾病的提供重要参考依据。但是,现有的中矢状面提取算法通常存在提取效果不佳、计算成本大和鲁棒性差等问题。  因此,本课题提出了一种基于深度学习的中矢状面提取方案,方案分为三个步骤:(1)使用图像分割网络识
学位
近几年,基于图结构的卷积神经网络技术的发展使得知识图谱中的节点信息能够通过训练得到更富有语义的表示,与此同时,一些工作表明了知识图谱能够通过增强推荐数据集中的项目实体而对推荐算法起到一定的优化作用。为此,以基于知识图谱图卷积神经网络的推荐算法为主要研究目标,开展图谱数据完善、卷积计算、基于图谱的推荐方法的研究。  研究利用知识图谱广泛的结构信息对用户、项目交互数据进行补充,在整合了知识图谱中项目属
学位
乳腺癌是女性中最常见的癌症之一,早期的筛查以及诊断非常有意义。乳腺肿块是早期乳腺癌的主要表征之一,当前乳腺癌筛查最有效的手段是乳腺钼靶X线摄影检查。研究乳腺肿块分割算法,通过准确分割乳腺肿块,辅助医生判断乳腺肿块的良恶性,有助于提高患者的生存几率,具有重要的临床意义。  乳腺肿块通常具有形态大小多样且边缘不规则的特点。针对乳腺肿块形态大小多样的问题,设计并实现了基于U-Net模型的MU-Net模型
随着计算机技术和医学影像技术的发展,计算机辅助诊断治疗可以减轻医生的工作量和辅助医生诊断。人体肋骨包含了完整的腹部与胸部,具有相对稳定的形状,肋骨分割在医学上用途很广,可以检测骨头是否有骨折等异常,分段肋骨也可以作为参考物体,帮助定位其他结构,比如肝脏,心脏等,还可以为一些量化任务提供参考,比如肺体积的估计。  肋骨与肩胛骨、脊柱以及胸骨粘连较近且灰度值相似,传统的分割方法不能很好地处理骨头连接处
学位
尽管深度神经网络目前在许多方面展示出强大的能力,但由于其高能耗的特性,无法应用在一些计算资源有限的场景下。而脉冲神经网络作为第三代神经网络,是目前最拟合生物神经元机制的模型。相比深度神经网络,在脉冲神经网络所需的计算量和能耗远小得多。  目前,脉冲神经网络在图像识别和目标检测方面达到了较好的效果,但对于更复杂的计算机视觉任务相关研究却很少。作为计算机视觉领域最重要的任务之一,目标跟踪有较高的实时性
学位
目标检测技术是计算机视觉领域内的研究热点之一,其成果被广泛应用于智慧安防、自动驾驶等领域。随着深度学习技术的发展,目标检测技术取得了突破性的发展,但对于小目标和低清目标的检测精度仍有待改进,这使得目标检测技术在实际应用中依然有很大局限,所以如何设计能够准确检测小目标和低清目标的算法对于推广目标检测技术的应用有重大意义。  立足于目标检测技术对于小目标和低清目标检测不够准确的问题,通过研究突破相关技
学位
目标跟踪是计算机视觉领域最热门且最具挑战性的研究内容之一,在自动驾驶、视频监控等领域有着广泛的应用。近年来,基于深度学习的目标跟踪方法因其对深度架构的使用,更具表现力的深度特征等特点在目标跟踪领域引起了广泛的关注和研究。其中孪生区域候选网络SiamRPN从目标检测领域获取灵感,将孪生网络和区域候选网络相结合,在保证实时的同时,取得了较高的准确性。然而SiamRPN使用AlexNet作为骨干网络,受
学位