论文部分内容阅读
伴随着互联网技术的迅猛发展,人们之间信息交流的方式也发生了巨大的变化,信息传播的速度和规模都达到了空前的水平,特别是在社交网络出现之后,人们可以通过各种终端设备在这个平台上随时随地发布自己的动态,每天在社交网络平台上都会产生海量的数据,社交网络在消息传播中扮演者越来也重要的角色。新浪微博,国内最大的社交网络平台之一。微博用户可以通过相互之间的关注机制分享消息,由于微博消息的传播具有实时性特点,并且不受空间地域的影响,使得微博在人们日常交流中扮演着越来越重要的角色,大有超越传统媒体的趋势。因此,对于新浪微博的研究蕴含着巨大的科研和商业价值。其中,对微博用户影响力的研究就是当下最热门的社交网络课题之一。因为微博上的各种交互活动也属于用户的主观行为,所以本文基于人类行为动力学相关理论,提出了一种实时的计算新浪微博用户影响力的方法。本文主要工作包括以下几点:首先,阐述复杂网络的概念,通过对社交网络和复杂网络的研究表明,社交网络属于复杂网络的一种,具有复杂网络的两个基本特点:小世界性和无标度特性。同时还论述了社交网络的发展和研究现状。其次,通过新浪提供的API结构设计了微博数据爬取程序,用来爬取本文所需要的实验数据,然后结合人类行为动力学的相关理论,研究证明了用户的转发行为的时间间隔是服从幂律分布而不是泊松分布的。再次,对用户的关注行为进行了数学建模,量化了特定时刻用户之间的关注程度。基于PageRank的思想提出了本文的用户影响力评估算法-RTRank。 RTRank算法是基于网络结构和用户行为的时间间隔分布规律来实时计算用户影响力,实验证明本算法具有良好的收敛性和实时性。最后,用粉丝量和PageRank算法分别计算用户的影响力,并利用Spearman相关系数计算RTRank算法和这两个算法的相关性,对结果进行分析表明,本文中的方法在计算用户影响力上表现的更加全面,而且具有很好的实时性。