论文部分内容阅读
随着Web2.0概念的深入人心,博客、社交网络、微博等社会媒体相继出现并逐渐盛行,互联网社会媒体逐渐成为人们日常生活中重要的交流平台。复杂网络的研究近年来取得了较大的发展,其复杂性探索逐渐成为热门的研究课题,为我们认识和探索客观世界提供了全新的科学视角和新方法。将复杂网络研究方法应用于社会媒体实体关联网络的复杂性研究是一次探索性的尝试。本课题的研究目的就是通过对社会媒体中的实体进行提取,构建基于实体关联关系的复杂网络并对其进行深入研究分析,以期达到对社会媒体实体网络更深入的认识。首先,介绍了社会媒体与复杂网络的基本概念,并对基于复杂网络的社会媒体研究进行了详细的综述。其次,从维基百科中抽取了人物关系知识网络,计算其网络参数,研究其小世界性和无标度性,发现人物关系知识网络是一个典型的复杂网络,符合真实社会网络中的小世界特性和无标度特性,具有和其它社会网络类似的网络特征。采用复杂网络中心性研究方法对网络进行中心性分析,挖掘网络中的重要节点,发现当代的基本都集中在娱乐圈,古代的基本都是著名政治风云人物,这与维基百科的词条是由网络用户自由编撰的,其内容的丰富程度符合普通百姓的兴趣点是密切相关的。最后对网络进行社团检测,并深入分析了典型社团中成员的特点,发现同一社团中的成员聚集在一起是可以解释的,他们或者属于同一家族,或者从事同一职业,或者经历共同历史事件,从而验证了利用社团检测方法挖掘出的社团的合理性。这一研究方法对于推动维基百科知识网络的更深层次、更细粒度研究具有一定意义。再次,对微博话题词网络进行深入研究分析。近年来对于话题分析与计算的研究主要集中在话题的检测与跟踪,对于话题关联关系的形式分析、话题宏观分布规律发现等方面的研究目前还未开展。本文首次将复杂网络的方法应用到话题宏观分布规律发现的研究中。研究其网络拓扑关系,发现微博话题词网络是一个典型的复杂网络,符合真实社会网络中的小世界效应和无标度特性,具有和其他社会网络类似的网络特征。利用multilevel算法对其进行社区检测,发现网络具有明显的社区特征,社区内部规律明显,属于同一个社区内部的话题词的相关度比较高。最后提出一种基于复杂网络的微博话题舆情热点发现方法,该方法利用复杂网络发现中心节点的能力并结合话题词频数变化趋势,可以有效的发现当前时间内的热点话题,并可以对其热度进行定量评估。最后,对所做工作进行了总结与展望,提出了使用复杂网络的分析方法对后续话题演化规律进行分析的可能性,为以后的研究指明了方向。