论文部分内容阅读
随着互联网技术的不断发展,在线社交网络已逐渐成为互联网中最流行的交流平台。社交网络中的用户可以相互结识并分享传播各种信息。社交网络中的海量用户及用户发布的信息具有巨大的商业价值和研究价值。不同用户所拥有的影响力和信息资源也直接反映了该用户所蕴含的巨大商业价值和传播潜力。发现社交网络中影响力较大的节点具有巨大的社会价值和商业价值,它对于信息传播、商品推荐和舆情分析等方面都有重要意义。所以如何有效的衡量社交网络中不同用户所产生的实际影响力,进而挖掘其中的潜在价值就成为了一个急需解决的问题。 首先,本文分析了社交网络的结构特性,包括六度分割理论,150法则和度服从幂律分布。其次,本文介绍了几种经典的中心性分析法,包括度中心性、紧密度中心性和介数中心性。这些中心性测度的计算方法分别从不同角度计算节点的重要性。再次,本文详细分析了基于链接分析的HITS算法,并将其应用到社交网络中用户影响力的评估中。通过分析我们发现,HITS算法在对用户进行影响力评估时存在一些问题。因为在真实的社交网络中,用户不只影响与其相链接的用户,同时还会影响与其没有链接的用户。而HITS算法在评估用户影响力时只考虑了与其有关联的用户,却忽略了与其没有链接的用户。另一方面是,HITS算法在评估用户影响力时忽略了用户之间的多重加强关系。这样就使得用原始的HITS算法对用户影响力进行评估后,容易产生与实际情况不太符合的结果。 鉴于此,本文针对HITS算法所存在的问题做了如下改进。首先对不同用户的Authority属性和Hub属性都根据该用户所具有的综合属性设置了相应的值,不再是同等对待。同时,把用户的影响力分为了两部分来考虑,同时考虑了与该用户相关联的用户和与他没有关联的用户。因此,本文主要给出了一个基于用户属性矩阵和HITS算法的社交网络中用户影响力评估算法。同时,本文通过Github社交网络中真实用户数据对两种算法进行了验证分析。实验结果表明改进后的算法比原始的HITS算法更适合于对社交网络中节点的影响力进行评估。