异质网络的节点影响力研究及应用

来源 :东北大学 | 被引量 : 0次 | 上传用户:caorongbb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然界的演化与人类社会的发展并不是简单的遵循随机规则,而是受到一定的潜在规律所支配,对这些自然规律的探索长久以来吸引着无数科研人员的目光。近二十年快速发展的网络科学从全新的视角为研究人员提供了一系列理论与研究工具,用于探索自然界和人类社会的奥秘。其中,从微观的角度对研究对象“影响力”的研究逐渐成为了解分析以致控制预测宏观复杂系统的重要途径。随着网络科学在跨学科领域的飞速发展,节点影响力的度量方法与研究受到越来越多的关注:信息安全领域的专家学者通过挖掘和识别复杂网络中的重要节点,避免大范围的级联失效发生;社会学家和经济学家将影响力排序结果应用在人类动力学研究、社会舆情研究以及用以指导营销策略;临床流行病研究的医学工作者通过对关键节点的识别进而抑制和控制流行病的爆发;生物学家从基因的重要性排序结果中可以对其关注的基因进行有针对性的生物实验,从而对人类的致病基因进行探索和机制的完善。诸如此类不同领域的广泛应用使得对复杂系统节点影响力的挖掘和排序工作具有理论意义和应用价值。
  首先,以节点的感染范围作为其影响力的衡量标准,针对仿真消息、舆论等信息的传播实验以及对路由网络故障传播的级联失效模拟,提出具有传播结果互斥性的SIoR传播模型。详细研究并探讨了节点传播能力与网络结构异质性的关系,并从网络的k阶零模型角度详细分析了网络结构的异质性对节点影响力的稳定性及差异性的影响。此外,本研究亦在此深入探讨了感染概率的选取在节点影响力度量研究工作中起到的作用,旨在对当前以研究人员按其经验选取传播感染概率的工作进行有针对性的量化和指导,可以最大程度的缩短“遍历”工作的计算时间。更重要的是,尽可能避免过多的节点拥有相近甚至相同的感染能力,可以使后续对节点影响力的具体度量及排序结果更加准确。
  其次,从网络的结构特征出发,提出基于社团结构的节点影响力度量方法,用以挖掘网络中的超级传播者,并对节点的影响力进行有效且准确的排序。具体以确定社团结构及不确定社团结构两个角度,分别给出节点影响力的定义V-community(记为VC)和Community-basedCentrality(记为CbC)及计算方法。并在实际网络中,通过与经典的节点中心性指标的对比分析,验证本研究所提两个算法的可行性和准确性。其中CbC算法是针对解决VC算法计算出的影响力数值依赖社团划分算法这一问题而进行的改进。改进之后的算法不仅如前者一样可以挖掘出网络中潜在的超级传播者,而且由于CbC取值更加连续而非离散的特点,使得CbC算法更加适用于节点影响力的排序研究。
  最后,鉴于真实网络中的节点在功能属性上可能相去甚远这一特点,本文提出基于功能特征的节点影响力概念。并且定义了功能异质节点、异质边以及对应的权值计算方法,从而构建完成了功能异质网络模型。由于研究对象的不同,本文亦有针对性的对功能异质网络的节点和边进行功能属性赋值,并在此基础上,提出基于功能特征的节点影响力度量算法PAGERrank算法。以人类基因网络为研究数据,按照其致病基因的生物学功能以及基因间的异质关系(基因蛋白质交互关系或基因调控关系)建立基因功能异质网络,并以实际生物学实验数据结果证实,通过PAGERrank算法计算得到的基因RP-score数值大小可以作为基因影响力的度量指标,能够准确的衡量致病基因在基因网络中的重要程度,且在网络科学的角度下论证了RP-score衡量基因影响力的稳定性。
  此外,本文基于功能特征的节点影响力相关理论及算法的可行性和准确性已经在实际应用中得到进一步验证。具体产品为人类基因数据库PAGER2.0,基因可视化软件GeneTerrain以及对医学实验Meta分析的前期相关性研究数据挖掘。
其他文献
目标的位置与运动轨迹是无线传感器网络的基础信息,是基于位置服务实现的基础。卫星定位系统为室外环境下的目标定位与轨迹跟踪问题提供了解决方案。据统计,人类有80%以上的时间是在室内度过的,提供高精度的室内位置或者轨迹,是许多应用的基础。卫星无线信号会受到建筑物、墙壁等障碍物的严重影响,不能有效地在室内环境中工作。无线网络定位与轨迹跟踪问题涉及到计算机、通信、自动化与物理等多个学科的相关研究领域,为了提
随着互联网技术发展,信息的总量和增长速度严重超出了个人或传统的数据管理和分析方法所能接受、处理和有效利用的极限,引起信息过载问题。其中大多数信息过载问题源于非结构化文本数据,例如,社交媒体文本、网页、新闻文档以及学术论文等。因此,从大量文本数据中自动发现知识的文本挖掘和分析技术引起了学术界和工业界极大的研究兴趣和热度,成为大数据时代数据挖掘和自然语言处理领域的核心研究问题。  由于短语是自然、低歧
学位
行人检测技术应用于计算机视觉的多个领域,如视频监控、动作行为分析、汽车辅助驾驶、机器人控制等,具有广泛的应用前景和研究价值。多年来,行人检测技术取得了一定的研究成果,但由于行人较大的类内差异和场景的复杂性,仍然存在很多未很好解决的问题,需要进一步的研究。本文进行行人检测算法的研究选择了预处理环节、基于部位建模的分类器和自适应场景的模型推荐三个角度,并提出了改进方案。本文的主要研究工作和成果体现在以
学位
近年来,随着众多社会媒体平台的诞生和发展,其作为一种在线用户交互的工具,正在越来越深刻地改变着人们的工作、生活和交流方式,同时也生成了海量的用户信息。广大用户在社会媒体中所生成的大量文本文件,已经成为大数据研究领域最具代表性的数据资源之一,对这些用户生成的文本数据进行研究有着广泛的学术和商业价值。社会媒体文本研究作为一种对社会媒体中大规模数据在不同应用上进行分析、处理、归纳和推理的信息处理技术,近
学位
随着语义Web技术的不断发展和应用,万维网上充满了大量可读取、可被机器理解和处理的RDF数据,RDF数据关键字查询问题的研究已经成为当今语义Web研究的一个热点。无论是终端用户还是应用系统,都有着对RDF数据进行查询的需求。但是,RDF数据的标准查询语言SPARQL对于普通用户来说过于复杂,用户既不了解SPARQL查询的语法和语义,更没有掌握待查询的RDF数据的模式信息。因此,本文提出一种基于查询
机器翻译是实现“沟通无国界”这一梦想的核心技术,长期以来一直受到学术界和工业界的广泛关注。然而,无论是统计机器翻译,还是发展速度较快的神经机器翻译,都还有一些问题有待解决,包括:如何提高稀缺资源翻译任务上的翻译效果、如何在神经机器翻译中使用统计机器翻译中证明有效的方法、如何有效地利用骨架知识指导翻译、如何有效地使用语言学知识优化译文质量。本文通过引入多层次知识来解决机器翻译中存在的上述问题,多层次
基于服务的软件系统(Service-Based Software System,SBS)因其配置灵活、动态重构等优点,已经成为当前Internet环境中快速构建大规模、分布式应用的重要形式。随着近年来云计算技术的迅猛发展和广泛应用,越来越多的服务提供商开始将SBS部署到云平台上。然而,由于云资源的按需分配和付费特征,部署基于SBS的云应用面临一个资源优化分配问题,即如何确定SBS各个组件服务的最优
学位
云计算是继分布式计算、网格计算和对等计算之后的一种新型的通过互联网提供服务的计算模式,其主要特点是按需使用、随时扩展和按使用付费。云提供者将底层计算资源(CPU、内存和存储等)配置成不同类型的虚拟机(Virtual Machine,VM)实例,并以VM实例的形式提供给云用户使用。然而,云计算资源的海量性、异构性和动态性等特点使得云计算资源分配变得更加复杂。如何合理而有效地将云计算资源分配给云用户达
学位
随着科学技术的快速发展,优化问题已成为人工智能领域及其他相关领域中重要的问题形式之一。近年来,优化问题呈现出愈发复杂的趋势,通常需要同时考虑多个相互冲突的目标并且需要同时满足多个约束条件,由此产生了多目标优化问题及超多目标优化问题。随着目标数量增加,问题的求解难度也不断加大,这使得超多目标优化问题的求解方法成为近期的一个研究热点和难点。此外,如何基于优化理论对其他领域中的复杂问题进行建模和求解也是
随着移动互联网技术和智能移动终端的快速发展,以位置服务为基础的社交网络、共享出行、交通导航、紧急救援等应用展示了巨大的市场前景,同时在室内展厅、大型超市、医院、会馆、监狱、影院、剧场及图书馆等室内环境中也涌现了大量的室内位置服务需求。室内位置服务是真正实现万物互联的基础,将成为下一个万亿级的蓝海市场,具有巨大的社会、经济和科技战略价值。如何实现高精度、低成本的室内位置服务已成为国内外研究的热点。 
学位