基于异质网络的影响力最大化算法研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:hongyanzhiji761112
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实社会中,网络无处不在,交通网络、社会网络、生物网络、电力网络、学术网络等,各类网络层出不穷,网络的规模也不断增大。因此,网络分析技术在许多研究领域正在发挥着越来越重要的作用,例如链路预测、信息扩散、社区检测等。近年来,受到“口碑效应”、“谣言控制”和“病毒营销”这些实际问题的影响,影响力最大化问题的研究日益引起人们的关注,成为新的研究热点。影响力最大化问题是指从网络中找到一定数目的节点,让这些节点在给定的影响力传播模型下可以影响网络中最多的节点,从而达到网络中影响力传播最广的目的。现有的影响力最大化算法大多是在同质网络上进行研究,忽略了网络中复杂的异质关系以及不同类型节点的特殊属性。由于现实生活中的网络几乎都是异质网络,现有的基于同质网络的算法在实际应用中受到了极大的限制,所以研究异质网络上的影响力最大化算法具有重要意义。异质网络结构复杂,且规模日益增大,如何利用异质网络复杂的结构特征以及不同类型节点属性来研究异质网络中的影响力最大化成为亟待解决的关键难点问题之一。面对这一难题,本文提出了两个异质网络影响力最大化算法MAHE-IM和SCHGTIM,分别从不同的角度整合异质网络中复杂的多重关系、高级的拓扑结构特性以及不同类型节点特征,充分捕获异质网络的异质性,从而有效地识别出异质网络中高影响力的节点。本文的主要研究工作和贡献如下:(1)提出基于多重异质关系嵌入的异质网络影响力最大化算法MAHE-IM(Multiple Aggregation of Heterogeneous Relation Embedding for IM)。该算法利用多种不同种类和不同长度的元路径下的异质网络嵌入捕捉复杂的多重关系结构和语义特征,并提出一个权重机制来刻画多重关系中全局和局部的特性,最终依据节点间的相关性以及节点在相关节点中的出现次数来综合选取影响力高的节点集合(种子集)。为了更全面地评估MAHE-IM,除了与四个已有的影响力最大化方法比较之外,我们将十四种常见的同质网络嵌入方法和异质网络嵌入方法扩展到影响力最大化问题,并与MAHE-IM算法进行比较。在五个异质网络上的实验结果表明,MAHE-IM算法选择出的种子集具有更好的影响力表现和更少的运行时间。此外,我们还从信息传播模型的迭代次数、种子集属性以及种子集尺寸等多方面与其他算法进行了系统的比较,进一步验证了MAHEIM算法的有效性。并且,为了最大化方便用户的使用,我们开发了MAHE-IM算法的在线服务平台,该平台除了MAHE-IM算法,还包括了我们扩展的其他影响力最大化模型的实现。(2)提出基于自监督聚类异质图Transformer的异质网络影响力最大化算法SCHGT-IM(Self-Supervised Clustered Heterogeneous Graph Transformer for IM)。影响力最大化问题与网络中高级的拓扑结构特征密切相关,而聚类方法可以有效地捕获复杂高级的网络结构,但现有的基于聚类的影响力最大化方法都是在同质网络上进行研究,基于聚类的异质网络上的影响力最大化方法还尚未有人研究过。另一方面,基于元路径的方法需要研究人员对数据集充分了解,对相关领域有足够的先验知识。针对这两大挑战,我们将属性图聚类方法与异质图Transformer方法融合起来,并应用自监督的训练方法,提出了SCHGT-IM算法。该算法将节点类型的元关系、边类型的元关系和聚类类型的元关系进行组合,同时抽取异质结构信息和节点异质性,之后根据节点相关性获取种子集。对于信息扩散模型方面,我们提出了聚类级联模型(Clustered Cascade model,CC model),从而使得信息扩散过程更加符合现实生活。此外,我们与五个常见的影响力最大化算法进行比较,并在三个异质网络上进行了实验,实验结果验证了SCHGT-IM算法在影响力传播以及算法效率上都优于其他算法。
其他文献
N6-甲基腺苷修饰也称为m6A修饰,是一种广泛存在于真核生物的mRNA和长非编码RNA上的高度保守的转录后碱基修饰。研究表明m6A修饰与许多生物学过程有关,包括且不限于蛋白质的翻译与定位、mRNA的剪切和稳定、RNA的定位和降解等。因此,准确识别RNA序列上的m6A修饰位点具有非常重要的生物学意义。传统的湿实验方法检测RNA中的m6A修饰位点面临着诸多局限性,例如需要耗费大量的时间和金钱、实验处理
学位
从2020年开始,新型冠状病毒肺炎在世界范围内全面爆发,并对全人类的生产生活造成了不可恢复的巨大影响,世界各个国家都损失惨重。以中国为代表的部分国家采取了及时有效的措施,遏制了疫情的发展传播,但是新型冠状病毒的变异毒株却一次次席卷重来,变异后的毒株在暴露条件下生存能力更强,生存时间更久,传染性更强。与此同时,新型冠状病毒肺炎的研究文献数量也急速增长。如果科研人员仅仅通过人工阅读的方式获取相关信息,
学位
随着深度学习的日益发展,各种神经网络模型被设计和搜索出来,大量网络模型广泛地应用在图像分类任务中。特别地,网络结构对于模型的最终表现是关键且重要的,特殊的网络结构往往会使得模型产生奇特的效果,因此人们对于寻找新型网络结构的需求变得迫切起来。然而,很多神经网络模型的结构是人为设计出来的,其中模型架构的设计过程需要先验的经验和高水平的知识作为支撑,较为费时费力,而且人为的经验在一定程度上会限制网络结构
学位
低碳混凝土技术的研发和应用,对“双碳”目标的实现具有举足轻重的作用,自燃煤矸石集料混凝土纳入了“低碳混凝土”体系,因此开展相关的基础研究意义重大。自燃煤矸石集料混凝土的脆性和抗冻等耐久性一直受到工程界质疑,而由玄武岩矿石熔融拉丝生产的绿色环保型玄武岩纤维是一种具有天然相容性的新型高性能无机纤维,与有机的纤维相比,具有良好的耐老化性,应用于混凝土中能提高混凝土的粘聚性、稳定性及混凝土的抗冲击性能,降
学位
本文介绍了固体废物治理技术及质控措施、生物处理技术、物理化学处理技术,以及固体废物资源化利用技术在环境工程建设中的应用。同时,介绍固体废物质控措施的研究和生物处理技术、物理化学处理技术在固体废物处理中的应用。这些技术能够有效控制固体废物治理过程中的环境风险,保障环境和人类健康安全,提高固体废物资源化利用率。
期刊
目前,青光眼是世界上第二大致盲疾病,每年有近167万人被检查出患有青光眼。开始是外围视力丧失,日趋严重变为严重视力丧失或者失明。到目前为止,青光眼是无法治愈的,只有早发现早治疗才可以阻碍青光眼的发展。识别青光眼体征需要具有多年经验和实践的专业眼科医生,但庞大的患者群体无法得到及时的诊断。因此,开发基于眼底图像分析的青光眼自动评估算法,将有助于减少眼科医生的整体工作量,并使诊断在更小的卫生单位更可行
学位
随着我国社会主义市场经济的腾飞,人民生活水平得到极大改善,对土木工程领域也有了更高的要求。今后的土木工程将要朝向节能环保,绿色可持续方向发展。近几年,对混凝土的需求量迅速增大,混凝土中骨料体积大约占70~80%,混凝土天然骨料储量匮乏,并且大规模的开采天然骨料会破坏原有的生态环境。本文使用固体废弃物煤矸石做骨料制作煤矸石混凝土,使用煤矸石即能减少对环境的污染又能弥补天然骨料匮乏的现状。纤维增强复合
学位
<正>2023年是毛泽东同志批示学习推广“枫桥经验”60周年暨习近平总书记指示坚持和发展“枫桥经验”20周年。广东省委、省政府历来高度重视人民调解工作,于2018年首次将人民调解纳入省十件民生实事。5年来,全省3.1万个调解组织化解矛盾纠纷221万余件,有力维护了社会和谐稳定。近期,省司法厅积极开展调研,梳理分析矛盾纠纷化解中存在的问题,并提出若干建议。
期刊
随着城市化进程的推进,地铁建设迅速发展,其安全性能受到广泛关注。在最近的几次严重地震事件中(如1995年的神户地震、1999年的科贾埃利地震、1999年的集集地震和2008年的汶川地震),结构的严重破坏引起学者们的广泛关注,地震地区的地铁的抗震设计变得尤为重要。地铁通常是在一组既存的结构下面或附近建造的。在地震作用下,地表结构、土壤和地铁车站三者之间存在着复杂的相互作用。这种相互作用会改变地震波传
学位
<正>研究目的:本研究立足于"双减"政策背景,对小学阶段校园足球的现实困境进行深度分析,并提出相应的发展对策,旨在进一步促进小学阶段校园足球的普及与发展,提高该阶段校园足球水平。研究方法与思路:本研究通过分析相关文献及政策文本,构建研究思路,铺垫理论基础;通过问卷调查、
会议