融入句子中远距离词语依赖的图卷积短文本分类方法

来源 :计算机科学 | 被引量 : 0次 | 上传用户:mfktadxxxa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着图神经网络技术在自然语言处理领域中的广泛应用,基于图神经网络的文本分类研究受到了越来越多的关注,文本构图是图神经网络应用到文本分类中的一项重要研究任务,已有方法在构图时通常不能有效捕获句子中远距离词语的依赖关系.短文本分类是待分类文本中普遍较短的一类特殊文本分类任务,传统的文本表示通常比较稀疏且缺乏丰富的语义信息.基于此,文中提出了一种融入远距离词语依赖关系进行构图的图卷积短文本分类方法.首先结合词语共现关系、文档和词语之间的包含关系、远距离词语依赖关系为整个文本语料库构建一个文本图;然后将文本图输入到图卷积神经网络,通过2层卷积后,对每个文档节点进行类别预测.在on_line_shopping_10_cats、中文论文摘要和酒店评论3个数据集上的实验结果表明,所提方法相比已有基线模型取得了更好的效果.
其他文献
观测数据因果关系挖掘是很多学科的基础问题.然而基于约束与因果函数等的现有方法对数据的因果机制具有较强的假设,一般适用于低维数据,并不能很好地适用于存在隐变量的场景.为此,提出了一种基于信息瓶颈的因果关系挖掘方法,称为因果信息瓶颈方法.该方法将因果机制划分为压缩与提取两阶段,在压缩阶段,假设存在一个经过压缩的中间隐变量,在提取阶段,可能保留与结果变量相关的信息.在上述建模的基础上,通过推导其变分上界,设计了一种的基于变分自编码机的因果关系挖掘方法.实验结果表明,基于信息瓶颈的方法在合成数据中准确率提升了10
合作协同优化是目前针对大规模优化问题的最有前景的算法之一,该算法通过分而治之策略划分子问题,以进行协同进化.不同的子问题根据演化状态的不同对整体改善的贡献大小也不一致,因此均匀分配计算资源会造成浪费.针对上述问题,提出一种新颖的基于自适应资源分配池策略和基于竞争的群优化集成的竞争合作群协同优化算法.首先,考虑到子问题的不平衡性,将子问题对整体目标改善的动态贡献作为分配计算资源的标准;其次,为了更好地适应子问题演化状态,不固定资源分配单元,而是利用池模型进行自适应分配,并且在相同子问题连续迭代中避免重复评估
随着大数据时代的到来,各个行业领域需要处理的数据之间的关系数量呈几何级数增长,亟需一种支持海量复杂数据关系表示能力的数据模型,即领域知识图谱.虽然领域知识图谱展现了巨大的潜力,但不难发现目前仍然缺乏成熟的构建技术和平台.如何快速构建出领域知识图谱是一个重要挑战.在对领域知识图谱进行系统的研究后,提出了一种基于属性图模型的领域知识图谱构建方法.该方法对于存储在多种原始业务数据库中的结构化、半结构化数据,通过约定图数据库的数据对接协议、多种图实体模式和关系模式配置方案等方式,完成对应的高质量完整的图谱模式构建
如今,网络谣言、传染病、计算机病毒等负面影响力的传播,给社会稳定、人类健康和信息安全造成了巨大的隐患,识别它们的传播源,对于控制负面影响力造成的危害有着重要的意义.目前大多数方法都只致力于单个传播源的定位问题,而在实际网络中,负影响力往往来自多个传播源,而且需要进行传播过程的模拟;此外,由于忽略了顶点之间拓扑限制的差异,导致定位传播源的准确率不高而且需要大量的计算时间.针对这些问题,提出了一种基于极大似然的方法,利用少量观测点提供的信息来有效定位多个传播源.首先,提出了传播图的概念以及产生传播图的方法,根
空间众包用于解决带时空约束的线下众包任务,近几年得到了快速发展.任务调度是空间众包的重要研究方向,难点在于调度过程中任务和工作者的动态不确定性.为了高效地进行任务路径动态调度,提出了同时考虑任务和工作者的不确定性的空间众包任务路径动态调度方法,该方法进行了3方面的改进.首先,扩展了调度需要考虑的因素,除了考虑新增任务的时空属性不确定性之外,还考虑了新增工作者的交通方式和时空属性的不确定性.其次,对调度策略进行改进,通过使用聚合调度策略,对动态新增任务先进行聚合处理,随后再进行任务分配和路径优化,相比传统非
鲁棒性作为一种动态行为也是超网络领域的研究热点,对构建鲁棒网络具有重要的现实意义.尽管对超网络的研究越来越多,但对其动态研究相对较少,尤其是在神经影像领域.在现有的脑功能超网络研究中,大多是探究网络的静态拓扑属性,并没有相关研究对脑功能超网络的动力学特性——鲁棒性展开分析.针对这些问题,文中首先引入lasso,group lasso和sparse group lasso方法来求解稀疏线性回归模型以构建超网络;然后基于蓄意攻击中的节点度和节点介数攻击两种实验模型,利用全局效率和最大连通子图相对大小探究脑功能
基于方面情感分析(Aspect-Based Sentiment Analysis,ABSA)是自然语言处理的热门课题,其中意见目标抽取和意见目标情感极性分类是ABSA的基本子任务之一.而很少有研究直接抽取特定情感极性的意见目标,尤其是抽取更有潜在价值的消极情绪意见目标.文中提出了一种全新的ABSA子任务一抽取消极情绪意见目标(Negative-Emotion Opinion Target Ex-traction,NE-OTE),并提出了基于注意力机制和单词与字符混合嵌入的BiLSTM CRF模型(Atte
链路预测旨在利用可获得的网络拓扑信息预测未知的连接关系.基于路径联系的预测方法在无向网络中取得了较好的效果.然而,在有向网络下,相同长度的路径因路径中连边方向不同会造成节点连接强度不同,传统预测方法难以区分路径异构造成的差异.鉴于此,首先以边权矩阵量化各类有向边连接强度的差异,进而为节点间不同异构的多类路径计算其连接强度,然后区分同一长度路径下各类路径的作用大小,最后综合多阶不同长度路径贡献,提出了一种基于路径连接强度的有向网络链路预测方法.在9个真实网络数据集上进行了实验,结果表明,考虑路径连接强度差异
近年来,主题情感联合模型成为了无监督学习领域的一项重要研究内容,在文本主题挖掘和情感分析等方面均有实际应用.然而,在现实场景中,微博因其文字短小、结构不完整等特征,给主题情感联合模型带来了一定的挑战.因此,围绕微博主题情感模型展开相关的研究与改进工作,目前较为流行的主题情感模型——TSMMF模型(Topic Sentiment Model Based on Multi-feature Fusion)中引入了词向量技术,运用多元高斯分布从词向量空间中快速采样邻近词语,并替换掉原Dirichlet多项式分布产
长链非编码RNA (long non-coding RNA,lncRNA)在各种人类复杂疾病中起着重要作用.采用计算方法推断ln cRNA-疾病间的潜在关联关系不仅有助于理解疾病的致病机理,还有助于疾病诊断、预防和治疗.文中提出了一种基于集成回归决策树的lncRNA-疾病关联预测方法.首先,利用已知的lncRNA-疾病关联信息分别构建lncRNA、疾病相似矩阵、lncRNA-疾病关联矩阵;其次,基于lncRNA、疾病相似矩阵、lncRNA-疾病关联矩阵,从不同视角进一步构建lncRNA、疾病特征向量;然后