论文部分内容阅读
随着Web2.0技术的成熟,社交网络已成为人们沟通交流、传播信息的重要手段,在人们日常生活中发挥着越来越重要的作用。社交网络与传统的虚拟网络不同,它是现实社会活动的在线拓展,是在真实人际关系基础上建立的网络平台,具有人际关系的一些特征,研究社交网络的演化机制和发展特征具有重要的理论意义和应用价值。
论文以社交网络为研究对象,以复杂网络理论为基础,根据采集的科学网博客数据,对社交网络的拓扑结构进行了深入的分析和研究,提出了基于集散节点的社区识别算法和基于社区的链路预测算法,并通过实验对算法进行验证。本文的主要研究内容和创新点包括:
1、社交网络拓扑结构分析及实证研究。利用复杂网络的理论和方法,对从科学网博客采集的数据进行分析研究,验证了科学网博客作为在线社交网络,同样也具有无尺度属性和小世界属性。分析了由于该网络中存在相对较多的集散节点,导致网络的度分布函数幂指数小于正常范围。并通过逐步删除高连接度节点,观察网络破碎程度,分析了集散节点在维持社交网络链接中的重要性。
2、针对社交网络中的无尺度属性,提出了基于集散节点的社区识别算法。通过选择中心节点、合并中心节点和对非中心节点聚类,进行社区识别。分析了算法中的一些关键问题,并进行了实验验证,结果表明该算法能有效地提高社区识别的准确性。
3、在社区识别的基础上,提出了新的链路预测算法。算法中首先使用社区识别方法将整个网络分成多个社区,然后在每个社区内部计算局部节点的相似度,最后选出相似度高的节点对作为链路预测的结果,该算法在保证精确度的基础上提高了链路预测的速度。