面向社交网络的聚类分析与可视化方法研究与实现

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:zhuspecial
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社交网络中包含了实体之间的相互联系,对这些联系进行分析,可以提取出网络的组成模式以及演变规律。但是社交网络往往规模大,结构复杂,而且实体间的联系还会随着时间变化,所以如何对社交网络进行分析,从中挖掘有效信息并进行展示是一项有意义且具有挑战的研究。聚类是一种解决网络数据规模过大问题的有效方式,但是聚类过程中会存在簇数难以确定、聚类结果不稳定的问题。为了使聚类簇数尽量准确,我们基于现有聚类算法DCN(Community Detection based on Centers and Neighbors),提出了层次可视化辅助方式解决聚类中簇数丢失的问题,并且对DCN算法中多策略标签传递算法进行改进,解决聚类结果不稳定的问题。此外大规模网络相比用于实验分析的网络数据集具有一些特殊结构。由于大规模网络往往不是强连通图,还会存在大量内部联系紧密的孤立团结构,这些结构中节点数量少,在传统的聚类分析中易被忽略。因此在聚类过程中不仅需要对较大的连通图进行分析,还需要对这些孤立团进行检测,使得聚类后的结果能表现网络的整体分布情况。为了使用户参与聚类分析并对网络及其动态变化进行探索,论文设计了面向社交网络的静态和动态可视化方式,在此基础上实现了基于Web的面向社交网络聚类分析的可视分析系统,利用豆瓣电影数据提取的影人合作网络进行相关案例分析,验证了系统的实用性。论文的主要工作如下:(1)可视化辅助的聚类算法:为了解决已有聚类算法DCN中存在的中心点遗漏,标签传递结果不稳定的问题,本文提出可视化辅助的方式使用户识别潜在的社区中心点,参与聚类过程,并提出基于重要度的标签传递算法。为了降低在簇数较多的网络中用户检测潜在中心点的难度,本文融合层次聚类思想,使用户迭代识别潜在中心点。(2)大规模网络数据的聚类分析:为了检测大规模网络中大量存在的孤立团结构,本文通过分析密度极大值节点的1阶邻居情况,识别孤立团结构。为了检测大规模网络中的局部中心点,本文在标签传递过程中将无法分配标签的节点视为中心点,并基于更新后的中心点列表重新进行标签传递。(3)面向静态和动态社交网络的可视分析:为了向用户展示网络的静态结构和时间演变性,本文设计了用于展示不同层次的可视化视图。并且本文设计了原型系统,使用户能参与网络的聚类分析与可视探索。
其他文献
目的在妇科实施腹腔镜手术中采取中医情志护理,并对其护理效果进行分析。方法将2017年10月~2018年2月在我院实施妇科腹腔镜手术的80例患者纳入本次研究中,根据随机分组的方法
目的观察神经肽Y(NPY)双侧室旁核显微注射在瘦素(LPN)调节2型糖尿病大鼠交感神经活性(SNA)和压力反射功能中的作用。方法将20只SD大鼠给以高糖高脂饲料喂养建立2型糖尿病模型;依据
目的调查分析新疆疏附县户籍居民伤害死亡状况,为开展伤害预防工作提供依据。方法整理2017年1月1日至12月31日期间疏附县户籍居民死亡情况,计算伤害死亡率。抽样进行死因回顾
掩护梁是二柱掩护支架中受力最恶劣的部件,其可靠性是支架正常工作的保证。依据国家标准中相关液压支架试验办法,在掩护梁承受最恶劣的偏载工况下,按照国家标准中的强度条件,
鲇形目(Siluriformes)隶属硬骨鱼纲(Teleostei)、骨鳔鱼类(Ostariophysi),是一类主要生活在淡水、广泛分布于世界各大洲的鱼类。这个类群在种级和属级水平甚至科级水平的分类
本文介绍了SYBASEClient/server的先进体系结构,并根据作者本人对它的研究和应用体会,对其联机事务处理主要性能以及提高性能的先进技术和方法进行了分析和讨论。
在国际工程承包中,用改进的层次分析法以及模糊数学评判法来确定在项目风险源中各风险元素的权重,综合了各方面专家的意见,能够使项目的风险评价有一个较好的结果.
目的:研究普洱茶对糖尿病前期患者病情进展中脂肪因子的影响,探讨普洱茶改善患者糖脂代谢的可能机制。为糖尿病前期患者提供比药物治疗更易接受的治疗方法。方法:在T2DM患者的
中国歌剧《山村女教师》是2010年由著名作家刘恒编剧、郝维亚编曲的一部原创歌剧。题材选自真实的南方小山村的感人故事,是我国现代现实主义题材歌剧的优秀作品之一。无论从
目的:研究中老年男性血清睾酮和皮质醇含量变化及规律。方法:581例40岁以上健康男性以每10年为一年龄组,分为4组。以20~39岁健康男性110例作为对照组。均于上午8~10时静脉采血,分离血清,应用放免分析方