论文部分内容阅读
在这篇论文,我们改进 trawling;指出 trawling 错过的一些社区。我们使用 DBG (稠密的由两部组成的图) 识别一个潜在的社区的结构而不是 CBG (完全的由两部组成的图) 。基于 DBG,我们基于边移动建议了一个新方法从一张网图提取核心。而且,我们改进爬虫作为一个核心的扇子节省仅仅潜在的页;节省很多磁盘存储空间。评估属于一个社区的核心的集合,术语频率的统计被使用。在纸,实验的数据集在领域下面被爬“ .cn ”。结果表演我们的算法适当地工作;一些新核心能被我们的方法发现。