基于邻接熵和高阶结构的异质网络影响力最大化研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:ghjkevin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息网络普遍存在于现实生活中,如:社交网络、经济合作网络、交通运输网络等。各种网络正改变并重塑着人们的日常生活。而影响力最大化问题作为网络分析中一个重要的研究领域,其目的是在信息网络中寻找最具影响力的种子节点集合作为初始的信息传播源,使得这些种子节点组合在一起的信息扩散范围最大。该问题的研究对于控制舆情、制定营销策略、防范疾病爆发等都具有重要的理论意义和实用价值。目前,大部分影响力最大化的研究都面向只包含一种类型的节点和节点间单一关系的同质信息网络。而含有多种节点类型和链接关系的异质信息网络,保留了更多的信息,实现了对真实世界更完整自然的抽象。因此,引入异质信息网络有利于影响力最大化的研究。现有的异质网络影响力最大化算法也存在时间效率较低、影响力度量不够准确以及忽略节点间高阶结构关系等不足。为了应对上述不足,本文的主要工作如下:(1)提出链路熵和路径交互熵的概念,用于度量节点的影响力。其中链路熵计算度量节点的直接影响力。而路径交互熵则捕获了异质网络语义及结构信息带来的间接影响力。(2)提出基于元路径的邻接信息熵模型(Meta Path Based Adjacency Information Entropy,MPAIE)以及基于元图的邻接信息熵模型(Meta Graph Based Adjacency Information Entropy,MGAIE)实现异质网络影响力最大化。(3)考虑到异质网络中的局部小团体特性及节点影响力随传播距离增加出现衰减的情况,进一步提出基于高阶结构的异质信息网络影响力最大化模型(High Order Structure Based Influence Maximization In Heterogenous Information Networks,HSIM)实现异质网络影响力最大化。(4)在两个属于不同领域的真实异质信息网络数据集上,从影响范围、时间效率、参数分析这三个方面验证了MPAIE、MGAIE以及HSIM模型的性能。实验的结果表明,MPAIE和MGAIE模型相比其它基线方法能更准确地度量节点的影响力,同时模型的计算效率相比已有的异质网络影响力最大化方法也有明显提升。HSIM模型相比于MPAIE、MGAIE模型进一步提升了影响力度量的准确性,时间复杂度也进一步降低。
其他文献
特殊环境来源放线菌是活性天然产物的重要来源之一,蕴含大量未经开发的次生代谢产物资源,而基因组挖掘能充分揭示微生物的生物合成基因簇,有利于特境放线菌资源的开发和利用。本论文通过基因组挖掘发掘了两株特殊环境土壤来源放线菌的产生结构及活性丰富的次生代谢产物的潜力,通过培养基筛选确定了合适的发酵条件,扩大发酵并对其次生代谢产物进行了研究。论文主要内容分为以下三个章节。第一章综述了近几年微生物来源活性环肽类
学位
急性肺损伤(ALI)是一种严重的呼吸系统疾病,如果不及时治疗经常发展为具有很高的发病率和死亡率的急性呼吸窘迫综合征(ARDS)。湖北贝母是著名的中药材,具有镇咳、祛痰、平喘等功效。在这里,首次评估了湖北贝母提取物对脂多糖(LPS)诱导的ALI小鼠的影响,结果表明乙酸乙酯部分(EAF)显著降低了支气管肺泡灌洗液(BALF)的白细胞和中性粒细胞,肺指数以及肺匀浆的促炎细胞因子(TNF-α和IL-6),
学位
如今,社会已经进入信息化时代,各领域在面对信息化转型时会产生大量空间数据。因此,空间数据挖掘成为了不可忽视的研究方向。在空间数据挖掘中,快速且高效的空间co-location模式挖掘近年来得到研究者极大重视,收获了丰富的成果。Co-location模式的挖掘目标是识别空间事物之间的并置关系,因此识别出的co-location模式仅反映出空间事物之间的同位关系;基于团实例模型的传统colocatio
学位
脚骨脆属(Casearia)植物在南美和亚洲等国家已被用于民间医学,用来治疗溃疡、糖尿病和抗菌感染等。研究发现,该属植物中次生代谢产物主要以克罗烷型二萜、三萜、苯丙素类等化合物。药理研究也证明,该属植物的粗提物或单体化合物具有降血糖、抗氧化、抗炎、细胞毒性和抗菌等活性。基于现在具备的对植物中二萜类成分提取分离研究的经验和条件,以及对化合物进行抗炎活性研究的基础。本论文以采集自云南普洱的球花脚骨脆(
学位
蛋白质是生命活动最主要的载体,了解蛋白质的结构对于认识其功能有着至关重要的意义。近年来,用深度学习的方法从蛋白质的序列进行结构预测的工作已经有了巨大进展,作为蛋白质结构预测中必不可少的一步,蛋白质模型质量评估工作不仅可以帮助从模型池中挑选出最优的模型,也可以为模型进行局部优化提供参考,是蛋白质结构预测的最后一步。在蛋白质模型质量评估的研究中,使用深度学习模型进行蛋白质结构的特征表示学习是非常有效的
学位
社会网络是由网络中个体成员之间的交互作用形成的,被广泛应用于描述成员之间的相互行为。由于近年来社会发展迅猛,社会网络也呈现多样化发展,伴随着的便是网络信息的复杂化,也更加凸显了它的研究价值。社会影响力是在一定的网络下,个体能影响并改变其他人行为举止的一种能力。影响力最大化(Information Maximization,IM)问题旨在寻找网络中使信息成功传播最广泛的网络成员集合,以至于能够将这些
学位
烟草是我国重要的经济作物之一,云南省作为“烟草王国”,在烟草质量、产量、销售量与出口创汇等多项指标中多年连续位居全国首位,同时烟草也是云南省经济社会发展的重要支撑和财税收入的主要来源。烟支作为烟草最常见的产品,一直以来都是烟草行业发展的重点。目前烟支的高速生产线虽然能满足产量上的需求,但不可避免地给烟支质检提升了难度。在质检中,烟支外观瑕疵会直接影响香烟质量,如果次品大量流入市场,不但会降低消费者
学位
空间频繁并置(co-location)模式是一组空间特征的子集,这些特征的实例在地理空间中频繁地出现在一起。空间并置模式挖掘旨在从空间数据中提取人们尚未知道但潜在有用的信息从而更好地服务人类活动,它已经驱动了许多社会应用,如基于位置的服务、城市规划等。尽管对频繁并置模式挖掘技术已经开展了许多探索,但仍然存在一些问题:(1)空间实例的邻近关系计算完成后通常存储在内存中,这种方式收集候选模式的表实例具
学位
抚仙湖1米真空太阳望远镜(NVST)受到大气湍流的影响,观测图像通常伴随着模糊或严重退化、更多的噪声和局部细节丢失。虽然近年来深度学习被广泛用于图像重建,但它们通常仅适用于运动、抖动模糊,对于太阳图像的重建依然存在高频细节丢失、生成伪像、边缘轮廓平滑等问题。本文利用生成对抗网络(GAN)与弱监督学习(WSL)相关技术,针对上述问题进行了研究,主要工作如下:(1)提出一种基于双阶段特征金字塔网络(F
学位
脚骨脆(Casearia balansae),为大风子科(Flacourtiaceae)脚骨脆属植物。在民间,本属植物表现出抗疟、抗感染、抗炎等活性,用于治疗肠炎、胃溃疡、病毒感染、炎症等症状。脚骨脆中富含萜类成分,尤其是克罗烷二萜,为了发现更多有活性的克罗烷二萜,我们对脚骨脆的化学成分进行了深入研究。炎症,尤其是慢性炎症,涉及多种疾病的发病机制。过度的炎症介质是炎症反应的表现,对组织或机体有害,
学位