基于信息级联的社会网络影响力最大化与影响力预测研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:zhq2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随互联网技术的出现,各类在线社交媒体平台逐渐兴起,人们开始倾向于通过社交平台进行信息交流。用户通过信息交流而产生的转发行为形成了信息级联,信息级联不仅包含用户的社交活动信息,也反映了用户的喜好、价值取向等。因此,基于信息级联,对用户社交数据信息进行挖掘并分析是一项有价值的研究工作。影响力最大化与影响力预测是社交信息研究的重要方面,影响力最大化研究中通过评估用户的影响传播范围能够了解信息扩散的必要因素,影响力预测研究中通过预测用户的信息扩散情况可以更准确地估算其影响力值。二者相辅相成,紧密关联,但各自又面临不同的挑战。影响力最大化算法是通过评估用户影响扩散情况,遴选出能产生最大影响传播范围的指定数目用户集合,然而该类算法在面对大型复杂网络时,往往难以同时满足其求解精度与效率上的要求。影响力预测算法是通过消息的历史扩散信息,预测将来时刻影响的传播方向或规模,然而该类算法的预测效果依赖于特定传播模型的假设且常常受限于网络拓扑结构等信息。针对上述问题,分别进行深入研究并提出对应方案,具体工作内容如下:(1)传统爬山贪心算法尽管能以较高精度选取影响力最大的种子节点集,但因其需进行数万次的蒙特卡洛模拟运算过程,运行时间复杂度较高,在面对大型复杂网络时情况更甚。为解决这一问题,基于独立级联模型提出将蒙特卡洛模拟运算过程转化为局部概率解(LPS)函数。为验证该函数的有效性,融合种子候选池方案将LPS函数拓展到贪心策略算法中,提出基于种子候选的贪心(SCGreedy)影响力最大化算法和基于种子候选的偷懒贪心(SCLF)影响力最大化算法。在四个真实数据集上的实验表明,LPS函数的求解精度与数万次的蒙特卡洛模拟几乎一致且运行效率得到较大提升,提出的SCGreedy和SCLF算法在影响传播范围指标上与目前最先进的偷懒贪心CELF算法性能相一致,并且在运行时间上比CELF算法快了约五个数量级。(2)基于特定传播模型的预测方法不适用于现实社会网络中的信息传播情况,且影响预测效果的网络拓扑结构等信息难以获取。针对影响力预测研究中面临的问题,基于信息级联的时间序列信息,提出多重依赖扩散注意神经网络(MDDAN),通过循环神经网络和注意力机制分别捕获信息级联的顺序依赖与非顺序依赖关系。为提升基于级联的影响力预测模型的鲁棒性,提出基于级联的对抗优化(CAO)策略,并将其应用至MDDAN中,从而提出对抗性多重依赖扩散注意神经网络(AMDDAN)。在三个真实社会网络数据集上的实验表明,MDDAN的预测性能优于目前最先进的级联预测模型,且添加了对抗性扰动的AMDDAN提升了MDDAN的鲁棒性。
其他文献
随着国家经济的发展和交通基础设施的不断完善,近年来高速交通服务业迎来了巨大发展。为了满足高速交通用户的出行需求,交通服务的智能化发展是一种必然趋势。面向交通的智能对话系统应用于全终端高速交通平台,不仅能够解析客户咨询的业务意图并给出相应回复,而且能够通过一连串的对话指导用户达成某一项任务。近年来,基于深度学习的多轮对话系统快速发展,特别是研究者已经设计出了基于预训练语言模型的多样化对话系统,催生了
学位
文本分类在自然语言处理中是一个重要且经典的问题,它是指一个文本实例对应一个关联的标签。随着数据的爆炸性增长,迫切需要对文本数据进行分类处理,以挖掘其潜在的价值,这在学术界引起了广泛的研究。目前,在深度学习中,基于图神经网络的文本分类已成为重点的研究内容。其中,图卷积网络在文本分类中取得了优异的成绩,为了缩短图卷积网络的训练时间,一些研究人员提出了线性图卷积网络来优化它。但这些图卷积模型将每一层的消
学位
目标检测,作为计算机视觉领域的一个重要研究分支,旨在用边界框表示目标的位置,并给出目标相应的类别。现阶段,基于水平边界框表示的目标检测器在自然场景中的轴对齐图像上取得了优异的检测性能。但是对于遥感图像中存在的目标任意方向、密集排列、背景杂乱、尺寸小、长宽比高等现象,使用水平边界框表示目标会出现包含过多背景信息以及前景背景信息混淆的现象。这两种现象皆会降低检测器的精度。由此可见,如何设置合适的表示形
学位
随着云计算和机器学习技术的兴起,数据采集和数据挖掘变得更加普遍,决策树算法也成为了数据挖掘中最常见的分类方法之一,广泛应用在医疗诊断、信用风险评估等领域。然而在决策树训练的过程中,一些数据的收集会涉及到人们的隐私信息,这些隐私数据的泄露可能会直接冲击个人利益,甚至触犯法律条款。如何在决策树训练的过程中有效地保护用户隐私成为了近年来非常有意义的研究内容。目前许多传统的隐私保护决策树训练方案是通过参与
学位
图像分类是计算机视觉领域的重要问题,有着各种各样的应用。在图像分类领域,这些年涌现了许多算法。其中,核方法有着以下优势:1)可以将低维样本特征映射到高维空间,使原本线性不可分的特征在高维空间中线性可分;2)避免向量在高维空间中的复杂内积计算;3)有效减少了计算复杂度的优势。因此,本文围绕核方法,给出了两种图像分类方法。主要工作总结如下:(1)高斯过程分类是机器学习领域中的一类有监督模型,而其中的协
学位
自2003年来,韩国共实施了四次“英才教育振兴综合计划”,不仅为韩国的科技发展贡献了大量创新型人才,也使韩国逐步建立了相对完善的英才教育体系。该计划实施过程中遇到的问题及获得的经验对我国开展超常儿童教育具有一定的借鉴意义。本文对韩国英才教育的内涵、历史和政策演变、发展成效及面临的挑战等方面进行了系统介绍和分析,提出了对我国开展超常儿童教育的启示。
期刊
近年来,深度学习的发展使得多项计算机视觉任务达到了难以想象的水平。但是神经网络性能增强的代价是日益增加的网络计算成本和内存成本。这些代价严重限制了神经网络在一些移动平台上的部署和应用。因此,对神经网络进行模型压缩和加速逐渐成为一个亟待解决的问题。当前主流的模型压缩和加速的方法有剪枝、量化、知识蒸馏等等。其中剪枝是目前较为流行的方法。传统的通道剪枝方法通常分成三个步骤,首先训练一个参数冗余的网络,然
学位
复杂网络普遍存在于现实世界中,通过深入研究复杂网络有助于了解人类社会中的各种复杂系统。其中,边是网络的重要组成部分,但由于网络异质性,网络中仅有少数关键边对保证网络结构与功能起到决定性作用,通过识别复杂网络中的关键边能够以较低代价防御对有益网络的攻击或者打击有害网络以获得较大收益。然而,传统的网络中关键边识别方法从网络拓扑结构或信息传播角度出发手动设计单一度量指标或综合多个指标对边重要性进行评估,
学位
进化算法在最近受到了广泛的关注,成为优化领域的研究热点,而且在解决复杂优化问题上表现出了良好的性能。然而进化算法的性能高度依赖使用的交叉和变异算子,因此算子的选择和对应参数的设置成为影响算法性能的关键因素。但是算子的效果与问题特性有关,复杂优化问题大多具有多峰且不连续的景观信息,因此即使是解决同一问题,由于进化算法的随机性,每次运行得到的种群优化路径也是不同的,合适的算子和对应的最佳参数也会不同。
学位
深度学习模型的训练基于大量数据样本,这些数据的收集通常来源于多方,里面可能含有大量个人隐私数据,相比于把所有数据集中到一起,分布式学习可为用户提供更好的隐私保护。根据网络拓扑结构不同,分布式学习可分为有中心节点(参数服务器)和无中心节点(去中心化)两种。最近的研究表明去中心化算法具有较低的通信复杂度和与参数服务器算法相同的收敛速度。去中心化学习中,每个参与者与自己的邻居节点交互参数,这种情况下,即
学位