论文部分内容阅读
现实世界中,许多重要的数据都以复杂网络或图的形式存在,比如引文网络,交通网络,基因网络等。网络中节点本身附带的特征信息及节点之间的链接关系包含大量的价值信息。另外,动态网络中的时空依赖信息,对分析动态网络的变化趋势及预测网络中节点的行为也有着重要意义。然而当前的图嵌入方法并不能很好的实现网络图嵌入,比如:基于矩阵分解的方法能够捕获网络中的结构信息,但其受限于庞大的运算量从而无法处理大规模网络。基于随机游走的方法,也能学习到网络的结构信息,但不能捕获网络的全局结构信息也不能将节点属性、标签等信息利用起来。对于动态网络,当前的图嵌入模型主要是通过施加一个时间正则化来增强相邻动态网络镜像中节点表示的平滑性,并且假设动态网络的时空演化持续很短(如假设只持续两步变化)。当节点表现出明显不同的演化行为时,这些方法可能会失效。另外,当前的图嵌入模型多基于浅层模型难以捕获复杂网络的深层特征。随着深度学习技术的飞速发展,其在多个领域取得了长足的进步。本文将着重研究基于深度学习的图嵌入模型,并根据静态网络和动态网络的特性,提出分别能处理静态网络和动态网络的图嵌入模型。具体研究内容如下:(1)针对静态网络,为了解决当前方法不能同时编码网络结构信息和节点特征信息问题。本文结合图卷积神经网络(GCN)和自编码器(AE),提出一种可扩展的半监督深度图嵌入模型—Semi-GCNAE。利用GCN捕获原网络中节点4)的K阶邻域中所有节点的结构和特征信息,并以此作为AE的输入。AE对GCN捕获的K阶邻域信息进行特征提取和非线性降维,并结合拉普拉斯特征映射保留节点的团簇结构。通过引入集成学习方法,联合训练GCN和AE,使模型习得的节点低维向量表示能同时保留网络结构信息和节点特征信息。在五个真实数据集上广泛评估表明,本文提出的模型习得的节点低维向量表示能够有效保留网络的结构和节点特征信息,并在节点分类、可视化和网络重构任务中相比于现有模型性能有显著的提升。(2)针对动态网络,为了解决当前动态图嵌入模型,无法捕获动态网络中节点高阶相似特征问题。同时保证模型能有效的学习到动态网络的时空依赖信息。本文基于自编码器(AE)框架并结合卷积神经网络(CNN)和长短时记忆神经网络(LSTM),提出动态图嵌入模型—DynCNNLSTM。其能够同时捕获动态网络的高阶结构特征和时空演化特征,并生成每个节点的一系列时序节点向量表示。其中CNN层中的卷积操作用于提取网络中节点的高阶相似特征。LSTM层则用于学习动态网络的时空依赖信息。为了探究不同长度的历史时空依赖信息对模型性能的影响,本文借鉴Goyal等提出的dynGEM模型也引入回溯超参数(look back,简称lb)来控制模型学习动态网络时空依赖的长度。通过在一个模拟数据集和两个真实数据集上的链路预测实验表明,本文提出的动态图嵌入模型—DynCNNLSTM能够有效地捕获动态网络的高阶结构特征和网络的时空演化信息,相比当前模型有显著的提升。