论文部分内容阅读
随着大数据时代的来临,各类复杂网络的数据量级正在迅速增长,而原有的网络分析方法在海量数据面前显得无能为力,因此,针对复杂网络的研究及应用近些年来已经引起了学术界和工业界的广泛关注。该研究领域的研究基础和重点是如何高效地在复杂网络上进行网络分析任务,例如,节点分类、链接预测、社区发现等。为了进行网络分析任务,关键是网络表示学习,也就是网络嵌入,它的目的是将网络中的每个节点映射到一个低维的、分布式的向量表示空间。本文针对网络表示的已有工作面临的可融合性、计算效率以及超网络结构的三个挑战,系统性地进行了以下四个工作:(1)基于文本增强的普通网络表示学习。提出一个文本增强的网络表示学习方法,该方法通过引入节点的文本特征来学习更具区别性的网络节点表示,这种表示来自于网络拓扑和文本特征的联合学习,包含了双方共同的影响因子,同时采用负采样策略来提高计算效率。在三个真实世界数据集上的实验结果表明,我们提出的方法优于其他基线方法。(2)基于社区与文本特征的普通网络表示学习。在诱导矩阵补全算法的启发下,提出一个社区和文本增强的网络表示学习方法,该方法在矩阵分解的框架下将节点的社区和文本特征融入到网络表示学习过程中。在三个真实世界数据集上的实验结果表明,我们提出的方法优于其他基线方法。(3)基于转化策略的超网络表示学习。通过超图到普通图的转化策略,将超网络分别转化为五种类型的普通网络,即2-截图、关联图、关联图+2-截图、线图+关联图、线图+关联图+2-截图。然后在这些普通网络上分别基于Deep Walk算法进行训练获得节点向量表示。在四个超网络数据集上的实验结果表明,2-截图的节点分类性能优于其他图,关联图+2-截图的链接预测性能优于其他图。(4)基于超边建模的超网络表示学习。提出三个基于超边建模的超网络表示学习方法来有效地融合超边信息到网络表示学习过程中,同时采用负采样策略来提高计算效率。它们都将包含网络拓扑和超边信息的节点向量表示的学习过程表示为一个联合优化问题,通过利用一种有效的随机梯度上升算法解决联合优化问题。在四个超网络数据集上的实验结果表明,我们提出的方法优于其他基线方法。