论文部分内容阅读
最近几年,随着互联网的快速发展,网络社区用户数量急剧增加,大规模在线网络社区逐渐形成。在线网络社区用户已经成为互联网的重要用户群,在线网络社区应用的重要性已经可以和搜索引擎、即时通讯工具等相提并论。SNS社区、微博等在线网络社区作为新兴的主流互联网应用,已经聚集了大量的用户。随着智能手机等移动终端的发展,网络社区用户数量更是快速增长。网络社区的用户关系是一种复杂网络,复杂网络的社区结构发现一直都是研究热点。通过对现有社区结构发现算法的研究,发现现有的社区结构发现算法关于社区结构或者搜索目标的定义存在过紧或者过松的问题,本文提出一种新的社区结构定义方法;在该方法的基础上,本文还提出了一种基于边介数的快速社区结构发现算法。该算法具有新的社区结构发现策略,并且针对网络中不同的社区结构都能够快速收敛。同时,该算法还提出了关于重叠节点的发现策略,解决了现有很多社区结构发现算法把社区结构发现简单当做图形分割的问题,较好地解决了某些节点同时属于多个社区的情况。网络社区随着时间的推移不断变化,本身具有很强的动态性。社区的节点数量会增加或者减少,节点间关系会变得更加紧密或者疏远;与此同时,网络社区中满足社区结构的节点簇的规模以及它们是否还构成社区都会发生变化。为了预测网络社区在未来的演化状况,需要根据网络社区在过去表现出来的演化特征,建立能够反映社区演化规律的模型。本文针对在线网络社区演化不规则的情况,根据在过去演化过程中各特征的变化率来对未来进行预测,弥补了现有模型对规则特征变化的依赖。模型除了关注网络整体的演化外,还关注了网络中社区的演化规则,确保模型的演化结果跟真实网络社区具有相近的社区结构。在线网络社区结构发现与演化分析基础平台是一个综合性基础分析平台。论文对在线网络社区数据提取方法进行了研究,针对在线网络社区数据普遍存在限制的情况,提出了一种在线网络社区受限信息的提取方法;同时,在线网络社区的部分数据是动态生成,并不是直接写入静态网页,针对该情况,提出了动态网页数据的提取方案。最后,结合论文中提出的社区结构发现方法、演化分析技术以及社区数据提取方法,实现了在线网络社区结构发现和演化分析基础平台,第五章对该平台的设计和实现方法进行了介绍,平台能够为在线网络社区的结构发现和演化分析提供基础性的支持。