论文部分内容阅读
现实生活中有许多复杂的网络系统,例如社交网络、生物分子网络和互联网等,利用网络结构建模这些复杂系统的研究已为社会提供了诸多创新应用。网络表征学习(又称网络嵌入)是将网络的节点表征为低维连续空间中的向量,且同时保留网络结构及其固有属性的一种有效方法,推动了下游网络数据挖掘任务的重大进展,近年来受到了学术界和工业界的极大关注,工业界已将网络表征学习技术纳入了下一代网络分析平台的基础性架构。本硕士论文围绕大规模属性网络的高效表征学习提出了三种表征学习框架,主要研究内容如下:
(1)面向大规模属性网络的动态表征学习,提出了一种基于随机投影的高效动态属性网络表征学习算法,该算法分为静态学习和动态更新两个部分。首先,静态学习部分在网络表征中融合了节点的高阶结构邻近性和高阶属性邻近性,利用矩阵的乘法结合律设计了一种预投影机制,提升了大规模属性网络的表征学习效率;然后,动态更新部分通过增量矩阵计算实现大规模属性网络表征向量的高效迭代更新。
(2)针对大规模多层异质属性网络的快速表征学习问题,提出了一种基于随机投影的高效多层异质属性网络的表征学习框架。首先,将多层异质网络解耦为多个简单的同质网络和仅包含一种边类型的二分网络;然后,引入不同边类型的重要性将解耦后的简单网络重新分配权重后聚合为新邻接矩阵;之后,对新邻接矩阵进行图转换自动获得网络中不同长度的元路径信息,避免了需要手工选择元路径的问题;最后,利用随机投影矩阵代替图卷积神经网络中的权重矩阵,有效提升了网络表征的学习效率。
(3)针对时序网络的动态表征学习,提出了一种融合网络motif的动态属性网络表征学习框架。首先,设计了一种融合网络motif的图神经网络,可以有效融合网络邻接矩阵中成对节点间的网络结构以及网络motif矩阵中局部高阶结构特征。然后,为了有效且高效地捕获不同时间快照间的时间演化关系,设计了一种模拟时间维度上一维卷积操作的时间移位模块,并结合融合网络motif的图神经网络将网络的历史信息融合到网络的动态表征向量中。
本文在多个大规模真实网络数据集上分别验证了所提三种表征学习方法的有效性和高效性。
(1)面向大规模属性网络的动态表征学习,提出了一种基于随机投影的高效动态属性网络表征学习算法,该算法分为静态学习和动态更新两个部分。首先,静态学习部分在网络表征中融合了节点的高阶结构邻近性和高阶属性邻近性,利用矩阵的乘法结合律设计了一种预投影机制,提升了大规模属性网络的表征学习效率;然后,动态更新部分通过增量矩阵计算实现大规模属性网络表征向量的高效迭代更新。
(2)针对大规模多层异质属性网络的快速表征学习问题,提出了一种基于随机投影的高效多层异质属性网络的表征学习框架。首先,将多层异质网络解耦为多个简单的同质网络和仅包含一种边类型的二分网络;然后,引入不同边类型的重要性将解耦后的简单网络重新分配权重后聚合为新邻接矩阵;之后,对新邻接矩阵进行图转换自动获得网络中不同长度的元路径信息,避免了需要手工选择元路径的问题;最后,利用随机投影矩阵代替图卷积神经网络中的权重矩阵,有效提升了网络表征的学习效率。
(3)针对时序网络的动态表征学习,提出了一种融合网络motif的动态属性网络表征学习框架。首先,设计了一种融合网络motif的图神经网络,可以有效融合网络邻接矩阵中成对节点间的网络结构以及网络motif矩阵中局部高阶结构特征。然后,为了有效且高效地捕获不同时间快照间的时间演化关系,设计了一种模拟时间维度上一维卷积操作的时间移位模块,并结合融合网络motif的图神经网络将网络的历史信息融合到网络的动态表征向量中。
本文在多个大规模真实网络数据集上分别验证了所提三种表征学习方法的有效性和高效性。