图结构文本的节点分类方法研究

来源 :大连海事大学 | 被引量 : 0次 | 上传用户:iamwoceo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,互联网信息技术的发展日新月异,互联网产生了海量的文本数据。文本数据之间往往存在着联系,将数据本身抽象为节点,数据间的联系抽象为边,构成复杂的图结构化网络,而节点分类则是处理图结构化文本的一项重要任务。本文的研究内容针对如何提高图结构化文本中节点的分类效果,从规则图结构化文本的节点分类和不规则图结构化文本的节点分类两个方向进行研究,主要内容如下:一、在规则图结构化文本的节点分类任务中,传统的单通道神经网络模型仅考虑提取文本序列某一方面的特征信息,不够全面。针对这一问题,构建transformer-capsule集成模型,该模型采用双通道形式,上通道利用capsule模型提取出文本序列的局部短语特征,下通道利用transformer模型提取出文本序列的全局语义特征,然后进行特征融合,得到的特征向量兼顾了两个单通道模型的优点。此外,对传统的capsule模型做出了改进,在相邻两个胶囊层之间引入注意力机制,更合理地给参与信息传递的胶囊分配相应的权重值,从而降低噪音胶囊对分类结果的干扰。二、在不规则图结构化文本的节点分类任务中,目前GAT模型存在增加图注意力层数反而会降低模型分类性能的问题,普遍的图卷积层数设置为3层,远远达不到深度学习的“深度”要求。针对这一问题,在GAT模型中引入门控机制以及残差连接机制,构建GRGAT模型,一方面通过门控机制筛选过滤特征子空间中的无用信息,另一方面通过残差连接机制能够让信息流跨层融合。GRGAT模型将GAT模型中的3个图注意力层数增加到了18层,通过实验验证了GRGAT模型的有效性。
其他文献
强化学习是人工智能研究领域中一个热门的方向,被广泛应用在机器人控制,人机交互等领域。深度强化学习将深度神经网络与强化学习相结合,在原有的强化学习方法上对智能体以及环境的预输入做特征提取。Actor-Critic算法作为深度强化学习的一个经典算法,在解决连续空间的问题上有着良好的表现。但是传统的Actor-Critic算法中Critic网络使用的是单一的Q-learning输出序列,智能体状态和动作
学位
随着近年来互联网数据的海量增长以及人工智能的发展,知识图谱以强大的语义处理能力和数据互联能力为数据提供了一种新的表达、组织管理和挖掘方式。但是,构建数据嘈杂和信息抽取过程不确定,导致现有知识图谱通常存在缺失现象,因此推理知识图谱以补全具有重要研究意义。知识表示学习,作为知识图谱推理的常用手段,基于潜在特征,在计算效率上具有明显优势,但学习过程仅利用三元组信息,嵌入结果对样本数量和质量有一定依赖,稀
学位
图像语义分割技术是计算机视觉领域一项相对基础且具有挑战性的工作,其任务是为图像中每个像素分配相对应的类别标签。现如今,深度卷积神经网络已经成为图像语义分割的主流方法,基于深度神经网络的语义分割算法大多通过堆叠大量卷积层来提高模型分割精度,但面临分割算法参数量大、分割延迟等问题,不适用于实时分割场景。同时,很多实时语义分割算法为追求速度提升,致力于减少网络参数导致分割效果难以达到应用要求。本文基于深
学位
交通拥堵是大多数城市都存在的问题,自适应交通信号控制是减缓交通拥堵最有效的方式之一。自适应交通信号控制问题(ATSC)可以被建模为城市交叉口之间的多智能体合作博弈,其中交叉口相互合作以优化城市的交通状况。近年来,强化学习(RL)在处理序列决策问题上取得了显著的成就,可以很好的应用于ATSC中。因此,本文将多智能体强化学习应用于交通信号控制问题优化车辆的旅行时间。首先,真实交通控制环境中,交叉口的观
学位
随着海上运输业的快速发展,我国沿海已成为水上交通最繁忙的区域之一。沿海区域交通密度的不断增大对船舶航行安全提出了更高要求。航线规划作为船舶安全航行的基础和前提,在航运业中起着关键作用。现有的沿海船舶航线规划方法较少考虑实际航行规范和避碰规则,导致规划出的航线无法很好地应用于实际环境。综合考虑船舶航行的安全性、经济性与时效性等因素,对沿海船舶航线规划方法进行深入研究,有助于提高沿海船舶航线规划的整体
学位
随着互联网技术给人们生活带来的便捷性不断提升,人类对网络信息的依赖也逐渐加深、诉求不断增多。传统人工网络后台服务方式,已难以满足海量用户全时全方位咨询、投诉等应用需求,因此基于网络的自动问答模式俨然已成为当下网络的一种主流服务方式。受限于当前自动问答算法多是基于选择匹配的方式实现,问答匹配度低、解答方式简单,与实现“因问而异”、“以问解问”的目标需求,尚有很大差距。为解决上述问题,本文提出一种基于
学位
随着信息化社会的高速发展,传统中心化机制在社会各方面的应用遇到了巨大瓶颈,而以去中心化为主要特点的区块链技术的出现标志着新型信任机制的产生。区块链技术在近几年蓬勃发展,并凭借其去中心化、公开透明、不可篡改等优势得到广泛研究与应用。但是随着区块链上交易数量的增加和去中心化应用的增多,其容量问题逐渐凸显。为解决区块链的容量问题,研究人员提出了多种扩容方案,其中以“分而治之”为核心思想的分片作为目前最有
学位
随着位置感知设备和信息系统的普及,收集大量移动对象的数据(例如移动对象的轨迹)成为了可能,因此,如何小心管理以确保每个移动对象或者敏感位置的隐私性以及私密性变成了亟待解决的问题。近年来,在满足差分隐私的情况下,针对移动轨迹数据库的统计查询研究已经提出了许多机制。本文研究的课题是支持轨迹数据的个性化差分隐私保护算法,目的是使发布的数据在满足个性化差分隐私的同时,提高发布数据的准确性。在移动轨迹数据库
学位
国家行业标准《安全阀的设置与选用》(HG/T 20570.2)中对于换热管破裂工况安全泄放量计算仅仅讨论了一种高压流体为液相的工况,远远不能满足实际生产需求,本文以此为切入点,参考了相关文献的研究,以国外工艺包作为工程设计的标准,用工艺包中的数据予以核算,确定了各种工况下的换热管破裂安全阀泄放量的最优算法。
期刊
智能手机的普及使得移动APP被广泛使用。对移动APP进行可用性评估,可以帮助产品团队发现其中的可用性问题,提升产品的用户体验。由于移动APP使用情境多变,使得传统基于实验室的可用性评估难以很好地发现其在真实情境中的可用性问题,因此需要进行远程可用性评估。但目前的远程可用性评估方法大多限于可用性测试场景,不适用于自然场景,且存在过多依赖人工分析、较少考虑情境因素等问题。为解决上述问题,本文作者基于情
学位