基于贝叶斯推断的社交网络用户影响力研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:mipanglin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,社交网络呈现爆炸式的发展,其对现实社会产生越来越深远的影响。社交网络上活跃着数以亿计的用户,蕴含着海量的数据,对社交网络中用户影响力进行量化研究,有助于了解人类行为规律,并应用于商业推广、舆情管控、个性化搜索和链接预测等目的。PageRank算法可用于度量有向社交网络用户的全局影响力,但其仅利用社交网络拓扑结构信息并假定用户与好友间具有均等的局部影响力,因此将其直接应用于全局影响力度量是不准确的。通过引入对用户转发行为的分析,基于贝叶斯推断量化用户间局部影响力,并将上述贝叶斯量化值作为影响力分配权值,对PageRank算法进行改进,提出用户全局影响力度量算法——BPRank。BPRank算法中将用户转发微博的行为抽象为多项分布,以总体中的未知转发概率作为局部影响力的量化。且在分析经典统计推断方法不足的基础上,基于贝叶斯原理,首先根据用户间拓扑结构关系定义相似度的概念并给出计算公式,以此作为先验信息;然后结合转发样本,利用狄利克雷共轭分布计算得到局部影响力的贝叶斯量化公式。个性化PageRank算法是PageRank算法的延伸算法,可用于度量个性化用户的相对影响力。在定义上述相对影响力为正向影响力的基础上,提出另一种相对影响力——反向影响力的概念,并根据两者的差异给出反向影响力的局部随机游走定义。结合局部影响力的贝叶斯量化值提出反向影响力度量算法——BWPRank,其可用于链接预测。该算法首先根据社交网络拓扑图生成路径树,然后寻找合适路径,最后计算每条路径的转移概率并求和。最后,以真实新浪微博数据作为数据集,对提出的两个算法分别设计对比实验,证明对局部影响力的量化是全面合理的,BPRank算法和BWPRank算法是有效准确的。
其他文献
本文在对运动目标识别与跟踪算法分析的基础上,将新兴的基于GPU的单机并行计算技术用于运动目标识别与跟踪算法的研究中。主要研究了基于CUDA目标的预处理过程,传统运动目标的
近几十年来,传统的确定性数据(deterministic data)管理技术得到了迅猛的发展,在国民经济建设中起到了突出作用。在传统数据库的应用中,数据的存在性和精确性均确凿无疑[1]。
随着网络的快速发展,网络上存在的信息资源也迅速增长,传统的检索结果以线性列表的形式返回,缺乏有效的过滤、组织和汇聚,无法很好地体现文档之间存在的内在关联,而且展示方
随着教育事业的快速发展,考试在各个领域的应用变得十分广泛,因此对考试的研究也越来越深入。当前,指导考试研究的理论主要有经典测量理论和项目反应理论。经典测量理论由于
随着网络技术的飞速发展,全球数据倍增,为大数据的分析和处理带来了困难。Map Reduce作为新兴的数据密集型计算编程模型,在大数据分析与处理方面发挥了重要的作用。而区间连
应用运动捕捉设备能获取高度真实感的三维人体运动数据。然而,人体运动复杂多样,不可能采集到适合每种虚拟环境以及适合每种虚拟人的运动数据,由于捕获区域和设备的局限性,难以获
目标识别是计算机视觉的重要研究课题,而交通灯识别和阴影识别是目标识别中当前研究的热点问题。实时交通灯的识别在辅助驾驶和无人驾驶汽车方面有广泛的应用;而阴影消除关系
关联规则挖掘是数据挖掘领域中一个重要的研究方向,它可以在海量数据中揭示某些特定的规律,辅助决策者进行决策。作为关联规则挖掘中最耗时的部分——频繁模式挖掘,其算法的
随着计算机技术的飞速发展,各行各业对软件开发的效率、质量以及后期维护都有了更高的要求,然而传统的以数据库为核心的软件开发方法并不能很好地满足这些需求。领域驱动设计
虚拟化技术的广泛应用引发了对虚拟化环境下性能分析工具的需求。如不同虚拟机里的用户需了解运行在该虚拟机的程序的性能问题,以便优化程序性能及运行环境配置。这都需要对