论文部分内容阅读
中心性排名是识别多层网络关键节点或层的重要研究内容,它量化了复杂网络中有影响力的节点或层的重要性,被广泛用来描述复杂网络系统的结构和功能。在目前大数据背景下,它在信息检索和传播、疾病和链路预测、市场营销和广告投放策略等领域具有重要的研究价值和广泛的应用前景。现有的多层网络中心性排名方法不能有效识别多层网络重要节点,也缺乏权衡层的重要性对节点排名的影响。基于此,本文针对层间无连接多网络、层间连接多网络、相互连接多层网络和多层异构网络这几类网络研究中心性方法来获得多层网络重要节点或层的排名。本文的主要研究内容及创新点如下:(1)提出了层间无连接多网络节点中心性排名方法。针对当前层间无连接多网络节点排名方法考虑因素单一,只关注基于随机游走的动态过程或网络拓扑结构。本文首先提出了一种通用的拓扑偏置随机游走方法;进而,融入该随机游走,提出了一种拓扑偏置多PageRank中心性方法来获得重要节点排名。特别地,依赖于随机游走的偏置本质,区分出拓扑偏置多PageRank的加、乘和组合情况。实验结果表明拓扑偏置多PageRank中心性方法能有效地捕获层间无连接多网络中的重要节点。(2)提出了层间连接多网络节点和层共排名中心性排名方法。现有的多网络中心性方法能产生节点的排名,缺乏权衡层的重要性对节点排名的影响;此外,一些中心性方法不适用于大量层组成的多网络。为此,本文提出了一种适用于大量层组成的层间连接多网络节点及层共排名中心性方法。该方法不但考虑了整个多网络拓扑结构,而且也考虑了网络节点和层的二元性质。实验结果表明共排名中心性方法能更多地将中心性分配给那些接收来自高影响层和连接已是中心节点的节点,并且适用于有向/无向、有权/无权的大量层组成的层间连接多网络。(3)提出了相互连接多层网络节点中心性排名方法。真实世界的多层网络并非所有的节点为所有层所共享,因此识别出相互连接多层网络中关键节点对于理解拓扑结构和动态过程至关重要。本文提出了一种基于张量框架的中心性方法研究相互连接多层网络的节点排名,该方法能够量化多层网络中层的影响和节点中心性之间的关系。此外,该方法可灵活地整合各层间相互作用的先验知识,从而针对各种情况获得量身定制的节点中心性。实验结果表明提出的方法可以量化层间的相互影响,能很好地表征多层网络的结构与功能关系,也能更准确地识别相互连接多层网络重要节点。(4)提出了多层异构生物网络节点中心性排名方法。目前虽然多层网络的层包含了不同类型的边,但每层可能由异构二分图组成,例如多层异构生物网络是由基因多网络、表型网络和基因-表型二分关系网络组成,其中每层的基因根据已知的基因-表型二分关联关系与其相关表型连接而成为一个异构二分图,这种多层异构网络中心性方法还未被研究。为此,本文提出了一种适用于多层异构网络的拓扑偏置重启随机游走方法(BRWR)来识别疾病基因并进行候选基因的排名。通过调整偏置参数,BRWR可以探索蛋白质和基因之间不同层中功能和物理相互作用,并且能够促使游走者遍历在具有不同类型节点和边的异构网络上。实验结果表明,应用于多层异构网络上的BRWR方法能够获得更可靠的疾病关联的候选基因排名,能够预测未确诊的新生儿早发性综合征的疾病基因,也能生成SHORT综合征及其相关PIK3R1基因的网络表示。