论文部分内容阅读
自然界的演化与人类社会的发展并不是简单的遵循随机规则,而是受到一定的潜在规律所支配,对这些自然规律的探索长久以来吸引着无数科研人员的目光。近二十年快速发展的网络科学从全新的视角为研究人员提供了一系列理论与研究工具,用于探索自然界和人类社会的奥秘。其中,从微观的角度对研究对象“影响力”的研究逐渐成为了解分析以致控制预测宏观复杂系统的重要途径。随着网络科学在跨学科领域的飞速发展,节点影响力的度量方法与研究受到越来越多的关注:信息安全领域的专家学者通过挖掘和识别复杂网络中的重要节点,避免大范围的级联失效发生;社会学家和经济学家将影响力排序结果应用在人类动力学研究、社会舆情研究以及用以指导营销策略;临床流行病研究的医学工作者通过对关键节点的识别进而抑制和控制流行病的爆发;生物学家从基因的重要性排序结果中可以对其关注的基因进行有针对性的生物实验,从而对人类的致病基因进行探索和机制的完善。诸如此类不同领域的广泛应用使得对复杂系统节点影响力的挖掘和排序工作具有理论意义和应用价值。
首先,以节点的感染范围作为其影响力的衡量标准,针对仿真消息、舆论等信息的传播实验以及对路由网络故障传播的级联失效模拟,提出具有传播结果互斥性的SIoR传播模型。详细研究并探讨了节点传播能力与网络结构异质性的关系,并从网络的k阶零模型角度详细分析了网络结构的异质性对节点影响力的稳定性及差异性的影响。此外,本研究亦在此深入探讨了感染概率的选取在节点影响力度量研究工作中起到的作用,旨在对当前以研究人员按其经验选取传播感染概率的工作进行有针对性的量化和指导,可以最大程度的缩短“遍历”工作的计算时间。更重要的是,尽可能避免过多的节点拥有相近甚至相同的感染能力,可以使后续对节点影响力的具体度量及排序结果更加准确。
其次,从网络的结构特征出发,提出基于社团结构的节点影响力度量方法,用以挖掘网络中的超级传播者,并对节点的影响力进行有效且准确的排序。具体以确定社团结构及不确定社团结构两个角度,分别给出节点影响力的定义V-community(记为VC)和Community-basedCentrality(记为CbC)及计算方法。并在实际网络中,通过与经典的节点中心性指标的对比分析,验证本研究所提两个算法的可行性和准确性。其中CbC算法是针对解决VC算法计算出的影响力数值依赖社团划分算法这一问题而进行的改进。改进之后的算法不仅如前者一样可以挖掘出网络中潜在的超级传播者,而且由于CbC取值更加连续而非离散的特点,使得CbC算法更加适用于节点影响力的排序研究。
最后,鉴于真实网络中的节点在功能属性上可能相去甚远这一特点,本文提出基于功能特征的节点影响力概念。并且定义了功能异质节点、异质边以及对应的权值计算方法,从而构建完成了功能异质网络模型。由于研究对象的不同,本文亦有针对性的对功能异质网络的节点和边进行功能属性赋值,并在此基础上,提出基于功能特征的节点影响力度量算法PAGERrank算法。以人类基因网络为研究数据,按照其致病基因的生物学功能以及基因间的异质关系(基因蛋白质交互关系或基因调控关系)建立基因功能异质网络,并以实际生物学实验数据结果证实,通过PAGERrank算法计算得到的基因RP-score数值大小可以作为基因影响力的度量指标,能够准确的衡量致病基因在基因网络中的重要程度,且在网络科学的角度下论证了RP-score衡量基因影响力的稳定性。
此外,本文基于功能特征的节点影响力相关理论及算法的可行性和准确性已经在实际应用中得到进一步验证。具体产品为人类基因数据库PAGER2.0,基因可视化软件GeneTerrain以及对医学实验Meta分析的前期相关性研究数据挖掘。
首先,以节点的感染范围作为其影响力的衡量标准,针对仿真消息、舆论等信息的传播实验以及对路由网络故障传播的级联失效模拟,提出具有传播结果互斥性的SIoR传播模型。详细研究并探讨了节点传播能力与网络结构异质性的关系,并从网络的k阶零模型角度详细分析了网络结构的异质性对节点影响力的稳定性及差异性的影响。此外,本研究亦在此深入探讨了感染概率的选取在节点影响力度量研究工作中起到的作用,旨在对当前以研究人员按其经验选取传播感染概率的工作进行有针对性的量化和指导,可以最大程度的缩短“遍历”工作的计算时间。更重要的是,尽可能避免过多的节点拥有相近甚至相同的感染能力,可以使后续对节点影响力的具体度量及排序结果更加准确。
其次,从网络的结构特征出发,提出基于社团结构的节点影响力度量方法,用以挖掘网络中的超级传播者,并对节点的影响力进行有效且准确的排序。具体以确定社团结构及不确定社团结构两个角度,分别给出节点影响力的定义V-community(记为VC)和Community-basedCentrality(记为CbC)及计算方法。并在实际网络中,通过与经典的节点中心性指标的对比分析,验证本研究所提两个算法的可行性和准确性。其中CbC算法是针对解决VC算法计算出的影响力数值依赖社团划分算法这一问题而进行的改进。改进之后的算法不仅如前者一样可以挖掘出网络中潜在的超级传播者,而且由于CbC取值更加连续而非离散的特点,使得CbC算法更加适用于节点影响力的排序研究。
最后,鉴于真实网络中的节点在功能属性上可能相去甚远这一特点,本文提出基于功能特征的节点影响力概念。并且定义了功能异质节点、异质边以及对应的权值计算方法,从而构建完成了功能异质网络模型。由于研究对象的不同,本文亦有针对性的对功能异质网络的节点和边进行功能属性赋值,并在此基础上,提出基于功能特征的节点影响力度量算法PAGERrank算法。以人类基因网络为研究数据,按照其致病基因的生物学功能以及基因间的异质关系(基因蛋白质交互关系或基因调控关系)建立基因功能异质网络,并以实际生物学实验数据结果证实,通过PAGERrank算法计算得到的基因RP-score数值大小可以作为基因影响力的度量指标,能够准确的衡量致病基因在基因网络中的重要程度,且在网络科学的角度下论证了RP-score衡量基因影响力的稳定性。
此外,本文基于功能特征的节点影响力相关理论及算法的可行性和准确性已经在实际应用中得到进一步验证。具体产品为人类基因数据库PAGER2.0,基因可视化软件GeneTerrain以及对医学实验Meta分析的前期相关性研究数据挖掘。