论文部分内容阅读
随着3G、4G、下一代Web技术HTML5、云计算、移动互联网等新通信技术的飞速发展,信息传播进入了移动化、数字化、智能化、互动化的全新纪元。具有个性化、互动性、虚拟性、社会性及以用户为中心等新兴特征的社交网络在系统推荐、社会信息安全、知识共享等领域得到了广泛应用,成为新媒体发展中最具影响力的平台之一。然而,社交网络在系统推荐、社会信息安全、知识共享领域面临一系列问题,而意见领袖拥有的影响力能够丰富网络信息与知识,在社交网络中起到中介过滤、控制及桥接的作用,发现和培养意见领袖是解决这一系列问题的一种重要途径。因此,社交网络意见领袖的识别已经成为一个非常重要的课题。本文在深入分析意见领袖识别的演进路线及已有工作基础上,总结了基于行为和关系的社交网络意见领袖定义及特点,分析了社交网络用户行为和用户关系,并对社交网络意见领袖的存在性进行实证,提出了基于用户行为和用户关系的社交网络意见领袖识别指标体系。用户行为的识别指标包括活跃性和中心性,用户关系的识别指标指中介性。用户行为反映了用户在社交网络的行为状态,用户关系反映了社交网络中用户之间互动所形成的的社交网络关系,两者结合更全面、更充分地体现了用户在社交网络的活动行为和特点。同时,本文提出了基于用户行为和关系的社交网络意见领袖识别模型:首先,依据用户行为的活跃性指标,识别出社区活跃分子;其次,依据用户行为的中心性指标,从活跃分子中识别出主题意见领袖;最后,依据用户关系的中介性指标,从主题意见领袖中识别出真正的社区意见领袖。本文还设计了基于用户行为和关系的社交网络意见领袖识别系统框架,此框架主要包括数据获取、信息提取、社交网络关系图构建、意见领袖识别、结果可视化五个部分。实验中通过获取新浪微博用户关系及用户发文内容等数据,利用MALLET软件对用户发文进行主题分类,采用Python语言编写发现程序,完成了意见领袖的识别。与利用已有的PageRank算法和HITS算法筛选出的意见领袖相比,应用本文模型发现的意见领袖由于分析了网络结构、链接关系,以及其行为表现和发文内容,因而更符合真实社交网络的情况,而且该框架的方法灵活、结果可视。