论文部分内容阅读
随着互联网技术的飞速发展,各种类型的网络结构越来越复杂,用户难以直接从中发现有用的信息,因此对复杂网络的研究受到越来越多的国内外研究者的关注。研究人员发现大多数复杂网络都具有社区结构的共性。社区发现作为分析复杂网络结构的技术之一,通过发现网络中的社区结构,便于人们分析理解网络中的拓扑结构。同时现实生活中的网络结构总是随着时间的变化而变化。因此,通过追踪网络社区的演化,能够有效的了解社区结构的演变趋势。 本文通过分析目前复杂网络中的一些社区发现算法,发现传统的社区发现方法存在一些不足。为了能够更加准确的从大规模网络中发现社区结构,本文结合网络结构和节点的内容属性,提出了一种基于时态主题模型的社区发现方法。本文首先介绍了传统的一些主题模型和社区发现方法,分析比较各自存在的优缺点;然后在LDA主题模型的基础上引入引用论文信息和发表时间信息,根据动态主题模型划分时间片的思想,提出时态引用主题模型。再结合网络节点中用户的重要度,更加准确地获得各个时间段内作者的主题分布。最后克服传统的标签传播算法中没有考虑节点的内容属性以及标签更新过程的随机性等缺点,改进传统的标签传播算法,提出主题权重标签传播算法,发现各个时间段内不同主题下的社区结构,同时根据主题和社区结构随着时间的变化情况,分析演化过程。 本文以社交网络为背景,从用户对网络的影响出发,运用基于时态主题模型的社区发现方法对整个网络进行社区划分。本文首先根据DBLP文献数据集中论文作者之间的合作关系,构建作者合作网络的社交网络;然后利用论文标题、发表时间和论文作者信息,运用基于时态主题模型的社区发现方法,发现不同时间段内该网络下的社区结构并分析社区的演化情况。最后,对本文提出的方法进行实验验证,对主题模型的困惑度和社区发现的模块度指标进行对比和评估,证明了该方法在保证时间的前提下提高了社区发现结果的精确性。