论文部分内容阅读
随着社会和科技的发展,网络格式的数据变得越来越常见。网络可以很好地抽象包括社会关系、生态系统和在线社交平台在内的真实世界的复杂系统。认识这些复杂多变的网络、了解其性质与规律并挖掘其中有价值的信息是大数据时代带给我们的新挑战。在经历了近20年的发展后,网络科学的研究重点逐渐转向由多个网络复合而成的多层网络。其中一个重要问题是如何分辨多层网络中哪些网络层更重要。本文基于复杂网络理论、随机行走理论、信息论和图神经网络等技术,尝试从信息提取与挖掘的角度对多层网络关键层进行研究,旨在确定对多层网络结构、性质与功能有重要影响的网络层。本文的主要创新点如下:(1)考察了多层网络中网络层之间的合作与竞争关系,以此为基础量化分析了各层网络对整体网络连通性的影响,进而提出了一种度量网络层结构重要性的方法。实验表明我们的方法能有效地反映各层网络对整体多层网络连通性的影响,能够挖掘出被经典方法所忽视的信息。(2)考察了多层网络中网络层之间的动态变化关系,利用网络随机行走技术,提出了一种能更准确、更稳健地度量网络层中观结构变化的方法,并利用此方法提取网络中观结构发生重大变化的网络层。在多种网络模型中的实验显示,我们的度量方法对重要的中观结构变化更敏感,对网络噪声的鲁棒性也更强。(3)考察了多层网络分类场景下网络层的重要性,并提出了一种量化网络层对分类任务影响力的方法。在多层网络分类任务中,一些网络层可能包含有效的分类信息,而另一些网络层可能不包含有效分类信息。本文提出了一种基于神经网络的多层网络节点分类模型,并在分类准确度的意义上为不同的网络层赋予不同的重要性。与此同时,为了验证该方法的有效性,本文从信息论角度提出了一种估计网络结构中所蕴含分类信息的通用方法。实验结果表明,我们的多层网络分类模型在自身达到当前一流的分类水平的同时,能有效地指示对分类任务影响最大的网络层。