论文部分内容阅读
社区离群点是结合数据的社区特性和自身属性挖掘得到的一种特殊离群点。针对现有社区离群点检测算法忽略社区间的重叠现象而导致社区划分不准确的问题,提出一种将对象的特征属性引入到相似度和重叠模块度的计算中的社区离群点检测方法。首先根据节点间的相似度对节点进行聚类,然后根据重叠模块度的变化进行迭代聚类,多次聚类后选取重叠模块度最大的作为划分结果,最终根据特征属性的偏离程度来确定社区离群点,从而解决重叠社区中社区离群点的检测问题。实验结果表明,提出的算法不仅能准确地发现重叠社区而且能有效地检测社区离群点。