基于网络结构的半监督节点分类研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:yangtianmei01
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着大数据和人工智能的飞速发展,出现了各种复杂的网络结构,如社交网络、论文引用网络、基因工程网络等。这些网络中往往存储着很多有价值的信息,吸引了不少学者进行网络研究以探索网络中的重要信息。例如社交网络,通过探索网络中用户的连接关系得到用户的相关性信息,再进行分类学习,从而发现用户的兴趣喜好,来更好的服务于广告投放、营销、社区交流等领域。然而实际情况是网络中存在大量未标记的节点,使有监督分类学习较为困难。早期的解决方法是利用专家的经验来人工标记节点,这种方法耗时耗力,现在已不实用。如何利用已有的半监督分类学习模型对网络中的未标记节点进行分类预测成为热点问题。不同于一般的分类问题,网络中的节点不仅有各自的节点属性,还有网络连接关系。目前主流的节点分类方法主要有两类:基于表示学习的节点分类和基于深度学习的节点分类。前者一般只针对来自网络结构的信息来生成节点的向量表示,并应用到节点分类任务中。后者则基于网络结构和节点自身的属性来实现节点分类。论文在对基于表示学习的节点分类方法进行分析后发现:现有方法忽略了不同节点连接的网络结构不同的特点,例如未考虑节点的度这一信息。本文在对已有的网络表示学习算法和半监督学习算法进行深入研究的基础上,提出了一种基于网络结构的半监督分类学习算法,其改进思路如下:(1)改进随机游走策略,提出了基于可变长随机游走的网络表示学习模型,为网络中的每个节点设置惩罚因子来限制节点的游走序列长度,使不同的节点拥有不同长度的游走序列,这些节点序列相当于自然语言处理中的句子,将其作为输入应用到word2vec模型中,从而将网络结构的潜在信息转变成向量来作为节点的特征表示。(2)改进半监督分类算法,首先基于深度神经网络模型为未标记节点打上伪标记,然后混合已标记节点和未标记节点,并采用MixUp方法进行数据增广以得到新的节点集,最后将未标记节点的分类损失加入到模型的损失函数中实现模型的优化训练。将论文提出的方法在三个标准数据集上与目前较先进的几种方法进行了对比实验,结果表明:本文提出的方法相比已有的方法有更好的分类效果。
其他文献
镧系荧光配位材料因其多样的结构和优异的光学性能一直以来受到诸多研究者的青睐,并被广泛的应用于材料科学,生物医学等领域。镧系配合物中具有“天线效应”的配体吸收紫外光
在实际生活中,广泛存在由不同采样频率采集的不同特征集合所形成的混合采样数据。这类数据不仅不同采样频率数据之间特征集合不同,而且其样本数量也不一致,传统的分类方法不
微信公众平台一经推出就得到教育界研究者的青睐,分享式教学和学习兴趣也是教育领域研究的热点话题。但大部分学者对于微信公众平台辅助教学的研究主要是以大学生为研究对象,
早龄期模袋混凝土力学性能是影响其施工期结构安全性的关键因素之一,也是工程进度的制约因素,直接影响模袋混凝土服役期性能、耐久性及使用寿命。本研究将内蒙古巴彦淖尔市附
白血病作为一种目前较难医治的疾病,它的早期快速检测一直是生物学、医学等相关领域的研究重点。电化学传感技术由于具有选择性好、灵敏度高、分析快速、成本低等优点,已在生
新一代无线通信网络的兴起,是为了满足用户更为复杂的通信需求,网络中关键技术在发展中所面临的问题成为人们研究的重点内容。认知无线电在无线通信快速发展的过程中应运而生
电火花线切割作为非传统加工的重要组成部分,在加工工艺、切割材料研究等微观研究方面有较为长足的发展,但在控制方式上仍停留在PC与运动控制卡的固有组合。随着智能制造、5G
碰撞振动系统是典型的非光滑系统,而碰撞作为一种典型的非光滑因素,它是在机械工程中普遍存在的,在运行过程中,碰撞会影响机械系统的工作精度以及工作效率,并且会对机械系统
在联合试验系统运行过程中,过程可视化技术能够提供试验数据的多节点、多维度、多模式显示方式,使得试验人员能够实时、全面、准确地掌握试验过程,为试验决策的制定和执行提
近年来,可见光通信(Visible Light Communication,VLC)技术迅速发展,使其应用关注度与日俱增。VLC是利用可见光作为信息载体,能够在空气中直接传输光信号并在接收端完成光电