基于参考点的演化聚类算法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:ludongyan900209
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的蓬勃发展和人们采集数据能力的增强,实际生活中出现了越来越多的随时间变化的数据,我们称这类数据为演化数据(EvolutionaryData)。近年来,演化数据的聚类问题引起了很多研究者的兴趣。一般地,演化聚类的要求有两个方面:1)每个时刻发现的聚类结构要尽可能好地划分当前时刻的快照数据;2)每个时刻发现的聚类结构要尽可能保持时间平滑性,即和上个时刻相比,当前时刻发现的聚类结构尽量不发生太大的变化。演化数据聚类有很广泛的应用背景,其研究有着很重要的意义。本文从核心节点和参考点的角度来研究演化聚类。本文的主要内容包括三个方面。1)受静态社区发现算法Top Leaders启发,我们提出一个基于核心节点(LeaderNodes)的演化社区发现算法(EvoLeaders)。首先,我们基于结合时间信息的更新策略来得到每个时刻的初始核心节点。通过保持发现的初始核心节点集合与上个时刻核心节点集合的时间平滑性,来保证由这些核心节点发现的社区跟以前的结构尽量保持平滑。然后,通过一组分裂合并操作提高社区质量。在两个实际数据集上的实验结果表明,EvoLeaders算法比Top Leaders算法效果更好。该工作表明了从核心节点的角度进行演化社区发现的可行性。2)Top Leaders算法的主要缺点是需要人工输入社区数目。基于网络中每个节点与其邻居节点之间度的关系,以及节点之间共同邻居的重叠程度,我们改进了 Top Leaders算法,并提出了能够自动发现社区数目的AutoLeaders算法。在三个经典数据集上的实验结果表明,AutoLeaders算法不仅能够发现合理的社区数目,还能够发现合理的社区结构。进一步,基于两种时间平滑性策略,我们提出了在动态网络中发现社区的新的解决方案,即EvoAutoLeaders算法。在两个实际数据集上的结果表明EvoAutoLeaders算法的效果比较好。3)我们从参考点的角度来处理演化聚类问题。首先,我们引入了三种不同的参考点,以及相应的计算个体到参考点距离的策略。然后,基于r-dominance关系和多目标演化算法,提出了一个演化聚类算法(即rEvoC算法)。实验结果证明,与经典算法相比,rEvoC算法更适合聚类演化数据,而且能够取得更好的效果。总的来说,我们从核心节点和参考点的角度来处理演化数据聚类问题,并且通过实验证明了其有效性,而且效果比经典算法更优。本文的工作对演化社区发现和演化数据聚类方法研究方面具有一定的参考价值。
其他文献
随着我国经济发展进入新常态,房地产行业作为国民经济的支柱行业,房地产行业的发展对促进经济社会健康有效发展产生了重要作用。外部环境发生了变化,房地产行业也面临着新的
当前俄罗斯政坛要人(续)格拉乔夫,帕维尔·谢尔盖耶维奇─俄罗斯联邦国防部长1948年出生在图拉州尔瓦村。父亲参加过卫国战争,是科索哥冶金工厂的钳工,母亲是挤奶员。俄罗斯人。1991年
在我国社会主义市场经济环境下,制造业有着十分重要的地位。制造业在我国国民经济发展和社会建设方面都作出了巨大贡献。但就目前来看,国内制造企业在内控管理工作中还存在着
钢琴协奏曲《黄河》是中国钢琴协奏曲中最具影响力的作品之一,这部作品以人民音乐家冼星海的大型声乐套曲《黄河大合唱》为母版,由殷承宗、储望华、盛礼洪、刘庄集体改编创作而
配电网主要应用10KV变电站,配电网直接关系到工民用电安全,配电网出现故障将导致城市出现大面积停电事故,严重影响民众生活及经济发展。因此研制满足配电网应用的安全设备非常重
目的 :研究清肺抑火片的质控方法。方法 :采用HPLC测定清肺抑火片中黄芩苷的含量 ,TLC对大黄、栀子进行定性鉴别。结果 :HPLC方法用ODS柱 ,以甲醇 -水 -磷酸 (50∶60∶0.2)为
越南留学生在学习“是……的”句时,出现的偏误主要是误加、误用、遗漏。造成偏误的主要原因有母语负迁移、目的语规则泛化、简单类推等。 Vietnamese students studying “
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
唢呐,作为中国民族乐器,最早由波斯传入我国,有着悠久的历史。唢呐音色清亮,音量不大,穿透力强,管制木神,圆锥形,在哨子部位有一个铜管,最下面是像喇叭花的喇叭口,很多地方称