论文部分内容阅读
随着社会信息的不断网络化,通过互联网连接起来的人群越来越多,在互联网上发布的各种媒体信息更呈现出爆炸式增长。互联网上的在线社区不断涌现,为社会学的研究者提供了充分的数据资源;博客阵营不断壮大,各类檄文出现在门户网站的首页,己成为新的新闻来源;电子商务中,口碑式营销的全面胜利,更吸引了商界的广泛注意。
而相较于传统的静态网页信息发布模式,现在的互联网用户更倾向于在虚拟社区中以自己的用户体验为中心获取想要的信息。因此如何提高用户在虚拟社区中的用户体验便成为国内外学者关注的焦点。目前针对如何提高用户体验的研究主要是从两方面进行,一是对用户的行为和偏好进行建模,二是对用户所处的社会结构进行分析。而这两方面研究工作的前提就是要发掘虚拟社区的网络结构。
本文的主要任务就是对Web网络中虚拟社区的网络结构进行发掘。主要研究工作和贡献如下:
1.提出了一种关键节点识别方法。识别出的关键节点,综合了社会网络分析中点度中心性、中间中心性和权力指数三方面的属性,既是虚拟社区中的活跃节点,又是虚拟社区中的权威节点,同时还能起到很好的连接其他社区成员的作用。实验结果表明,用该方法找出的关键节点是与实际情况相吻合的。
2.提出了一种可对任意形式的虚拟社区网络进行社团划分的方法。通过综合图论中寻找连通分支的方法和复杂网络中挖掘社团结构的方法,对虚拟社区中的网络结构进行了定量地计算和划分,发掘了虚拟社区中隐式的、自动形成的社团结构。实验结果表明,这种划分是接近真实情况的。
3.提出了适应虚拟社区海量数据的结构特性的并行计算框架。在分布式平台上,利用搜索引擎中最新的MapReduce方法,在海量数据规模上对关键节点识别算法和社团结构挖掘算法进行了验证。实现了对活泼度和权威度完全无损的并行计算,以及对社交度和社团划分的近似的全局结果。实验结果表明,关键节点的识别算法和社团结构的挖掘算法在海量数据规模的情况下,仍然能够保证算法的效率和性能。