论文部分内容阅读
社交网络(Social Network Service,简称SNS)是现今互联网中的一个重要领域。SNS是一个基于好友关系的信息发布、分享的平台。随着移动互联网的发展,越来越多的人们能随时随地在这个平台上发布、分享消息。社交网络正在扮演着一个非常重要的消息传播平台。著名的SNS有Facebook、Twitter、YouTube、人人网、新浪微博等。由于社交网络是基于现实中的好友关系建立起来的网络结构,因此它既有网络结构也具有社交的特质。新浪微博作为国内著名的社交网络之一,它拥有超过三个亿的用户,每天都有海量的信息在这个平台上发布。新浪微博网络在信息传播中扮演着非常重要的角色,甚至有超越传播媒体的趋势。如“林书豪”事件率先是在新浪微博上传播,为人们所知。因此研究新浪微博网络是具有重大的商业价值与应用价值,研究用户影响力有助于理解消息传播模型。由于人们在社交网络上的动作也是人类的一种主观的行为,本文基于人类动力学的理论与研究方法,提出一种新的评价新浪微博中节点实时影响力的算法。本论文的主要工作有以下几个方面:首先阐述了复杂网络的起源、基本概念与两个基本特性,即小世界效应与无标度特性。已有学者证明在线社会网络也具有小世界效应与无标度,进而说明了在线社会网络是复杂网络中的一种。论述了社会网络的发展与分析方法,其中重点阐述了“六度分割理论”与“150定律”。之后简要介绍了在线社会网络的发展与研究现状。其次,通过新浪微博提供的API,我们采集了微博用户信息与微博信息。在这个数据集中,统计分析了新浪微博用户之间转发微博的行为,实验结果表明用户之间的转发行为时间间隔分布是服从幂律分布,这与人类动力学领域中的研究成果一致,即人类行为时间间隔分布是服从幂律分布,并且具有“胖尾”特性。再次,本文基于PageRank算法的基本思想提出一种社交网络用户实时影响力算法,这个算法称为Micro-blogging User Rank,简称MURank。MURank算法是基于用户之间转发行为的时间间隔分布规律与用户之间的网络结构,计算网络节点用户的实时影响力。通过评价微博网络中用户节点影响力,可以迅速地找到信息传播过程起关键性作用的用户节点,有助于理解微博网络中消息传播模型等。最后,分别使用粉丝数量与传统的PageRank算法来评价微博网络的用户影响力,我们分析了这两个实验结果与MURank实验结果,分析结果表明MURank算法具有比另外两种算法,具有更好的实时性。