面向图结构数据特征传播的节点分类研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:zyr1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着信息技术的快速发展,人们的生活已经越来越离不开手机、电脑等互联网产品。互联网的普及给人们带来巨大便利和乐趣,但不可避免地产生了大量的数据信息。这些数据信息的格式多种多样,不仅包含语音、文字、图像等典型数据,也包含以图结构为代表的非典型数据。节点分类任务作为图数据挖掘领域重要的分支之一,不仅在学术上有着十分重要的理论意义,也在工业上有着巨大的应用价值。图神经网络作为目前节点分类任务的最优秀模型之一,可通过图卷积操作来充分挖掘出图结构数据中丰富的连接信息。然而图神经网络仍然有着一些缺陷,在节点分类任务上有着一定的提高空间。本文在图神经网络的基础上总结了前人在节点分类任务上的研究,对现有模型进行了改进。本文的工作主要体现在下面四个方面:1)为了解决图卷积网络中的过平滑及内存消耗过大问题,本文提出了一种可以挖掘高阶邻居信息且适用于大规模图结构数据的模型。该模型采用残差特征传播的形式来聚合邻居节点信息,有效地增加了模型的深度,再通过神经网络来对每个节点进行表示学习,进而对节点进行分类。2)当前,大多数图神经网络都是采用平均聚合的方式来利用邻居节点信息,这使得邻居节点中的重要信息和噪声信息得到了平等对待。本文将节点与其邻居的余弦相似度作为特征传播时的权重,从而提出了带权特征传播。该模型的带权特征传播使得图中的节点得到更加合理的特征,大幅提升了节点分类效果。3)神经网络作为一个黑箱模型,很难解释和理解输入和目标之间的关系及联系。本文提出了一种可运用传统机器学习的分类算法来进行节点分类的模型,使得节点分类重新回归到机器学习中传统的分类任务中。节点特征经过特征传播聚合邻居节点特征后,便可以利用常用的分类算法对其进行分类。该模型具有很强的可扩展性和可解释性,传统的分类算法都可应用于该模型,可以根据数据的特征类型来选择合适的分类算法进行节点分类任务,分类效果也优于常见的图神经网络模型。4)本文基于Pytorch深度学习框架和Scikit-learn机器学习框架来实现算法模型。使用了4个公认的节点分类数据集,与目前较为流行的节点分类模型在分类效果、训练速度、模型深度等多个角度进行对比,验证了本文所提出的三种模型在节点分类任务中良好的分类效果。
其他文献
本文利用文献研究分析中小企业数字化转型现状,发现数字化转型过程中面临的困境涉及资金来源、技术基础、组织架构、战略柔性等诸多方面,利用TOE框架分析影响中小企业数字化转型的因素,发现中小企业完成数字化战略转型涉及到多种因素,企业转型过程中应注重各方面协调配合,统筹推进企业转型。本文丰富了针对中小企业实施数字化转型的一些相关研究,以期为推动中小企业开展数字化转型减轻现实困难,提供方法指导。
期刊
生物网络是用图模型来抽象表示生物复杂系统的一种复杂网络。比如,蛋白质相互作用网络、基因共表达网络、信号传递网络和生物代谢网络等都属于生物网络范畴。在后基因组时代,面向复杂生物网络的功能模块识别算法研究是一项十分重要的研究方向,有助于人们在生命起源、新型药物开发、疾病机理研究等众多领域有更进一步的理解和认识。随着高通量技术的发展,生物组学数据量急剧提升,如何在如此大量的网络数据中识别具有生物意义的功
学位
数字经济与企业创新是新常态下经济发展的重要议题。企业传统的创新模式过于单一,无法支撑企业跨越式发展。作为市场主体,企业不仅要通过双元创新(即探索式创新与利用式创新)确保自己的竞争优势,实现可持续发展。同时,也要顺应数字经济的变化趋势,完成当下的数字化转型。本文通过梳理传统创新模式及现有的双元创新局限性,以资源基础理论为基础,通过数字化转型手段,协调企业双元创新的内外部环境资源分配,以期通过企业创新
期刊
随着大数据时代的发展,作为一种能在保证客户端私有数据不出本地的前提下实现协作学习的机器学习技术,联邦学习(Federated Learning,FL)受到越来越多的关注。凭借其无需客户端上传原始数据就可以实现分布式处理数据任务的优点,联邦学习有望在未来的网络通信系统中发挥出重要的作用。但是,联邦学习这种独特的优势却使得服务器很难预估客户端对全局模型的贡献,从而难以有效地以一种公平的方式激励客户端参
学位
目前大多数声纹识别技术使用复杂度较高的网络模型,以达到更准确的识别精度。模型复杂度过高不适用于存储空间和计算资源不足的设备,例如手机、手环等。相比于高复杂度的模型,轻量级神经网络模型无论在存储空间,还是计算资源方面的需求都低得多。近年,基于深度可分离卷积的轻量级神经网络模型表现出了卓越的性能,将其中较为优秀的模型应用到声纹识别任务上发现,这些模型在性能和轻量化上无法达到很好的平衡。此外,日常生活中
学位
随着网络智能设备的日益激增,移动网络边缘产生了大量的异构数据,为了更好的处理这些异构数据,研究人员提出移动边缘计算(Mobile Edge Computing,MEC)架构,其通过将计算、储存能力下沉到网络边缘以消除云的压力,从而加快内容交付、提高服务质量。此外,随着移动网络上丰富的流媒体服务的数量不断增加,移动设备的流量和计算量都有了巨大的增长。边缘缓存作为一种新兴技术出现在移动网络的边缘,用于
学位
基于数字化发展趋势,探讨数字化转型与企业韧性的关系,以金风科技为例,研究发现:企业韧性主要表现为战略韧性、管理韧性、关系韧性、资本韧性。数字化转型通过提供信息化服务、实现智能化应用、完善数字化监管、开展数智化定制等路径提升企业韧性,主要表现为财务绩效提升、竞争优势形成、发展潜力增强、客户体验升级。上述结果表明,数字化转型确实能提升企业韧性。建议制造业企业加快推进数字化转型,提高韧性水平,政府部门持
期刊
在数字经济与实体经济深度融合的新背景下,基础薄弱、能力不足的中小制造企业,如何协调内外部资源推进数字化转型,成为学界和业界关注的焦点。对此,研究围绕宁波澳玛特冲压机床股份有限公司的数字化转型实践,系统剖析其推进数字化转型的阶段举措,并提炼出一个嵌入自主的过程模型。研究发现:(1)中小制造企业需把握嵌入与自主的双轮驱动,逐步突破资源识别、利用和创新的瓶颈,以实现数据可视、高效互联和智能运维的数字化转
期刊
随着手机等智能设备的普及与发展,人们可以随时随地分享自己的生活,发表自己的看法。基于位置的社交网络(Location-based social network,LBSN)也因此被人们所青睐而大量使用。其中最为流行的LBSN数据集,例如Yelp、Foursquare、Facebook等获取了大量的用户访问数据,包括用户的签到打分、评论、时间以及兴趣点(Point of Interest,POI)的地
学位
行人重识别(Person re-identification,Re-ID)的目的是通过多个不重叠的摄像机检索目标人物。随着深度神经网络的发展和智能视频监控需求的不断增加,ReID在计算机视觉界应运而生。近年来,基于深度学习的Re-ID方法取得了令人鼓舞的成果。随着封闭世界条件下的识别精度逐渐饱和,对行人重识别的研究焦点转向了开放世界。虽然开放世界更符合特定场景下的实际应用,但也面临着更大的挑战性。
学位