网络中极大k-plex发现算法和网络社群简历挖掘研究

被引量 : 2次 | 上传用户:SnailHou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对网络的挖掘已经成为数据挖掘领域中的热点。由于需要用图结构来描述的数据广泛存在于生物、化学、通信和社会学等众多领域,因此针对网络的挖掘有着广泛的应用。社群是网络中的相对密集的区域,其内部实体间存在着紧密的连接,而区域之间相互隔离或只有少许联系桥接其间。网络社群是我们了解网络的结构、功能和增长机制的一个重要工具。本文的工作围绕着对网络社群的分析展开,大体分为下面两部分。第一部分是对一种具体的社群结构——极大k-plex(k丛)的挖掘算法的研究。k-plex是众多网络社群定义中的一种,近年来一些使用k-plex对网络进行分析的方法和应用逐渐出现,但受没有高效的k-plex发现算法的限制,都只能局限在小规模网络上。我们提出了一种基于回溯的极大k-plex挖掘算法并提出了若干剪枝策略来提升算法的性能。为了分析更大的网络,我们也讨论了算法的并行化,并研究了计算单元之间的负载均衡策略。我们还针对对k-plex规模的限制提出了一些近似算法策略以进一步提高算法的性能。在这一部分的最后,我们对算法和各种策略的效果进行了实验并且进行了分析。应用各种算法从网络中挖掘出社群之后,为了进一步应用网络社群信息,更好的了解在现实中社群的概况和动态,我们又提出了针对网络社群的简历挖掘,并且研究了其中的三个问题:社群的特征化、社群的区分和社群演化历史的挖掘。社群的特征化算法试图提示社群形成的原因;社群区分算法则要寻找一个社群最独特的特征;而社群的演化历史挖掘则利用网络中不同时刻的快照来挖掘社群的演化轨迹。最后,我们用两个实际的案例来展示了社群简历挖掘的效果。
其他文献
变电站电气设备的安装质量关系着安装工程的顺利进行,影响着电力系统整体的稳定运行,与人们的日常生活息息相关,对社会经济的正常有序发展起着举足轻重的作用。因此,我们应该
据IDC、Gartner等权威研究机构分析,经过十余年IT基础建设的发展积累,中国IT行业已全面进入服务时代。IT咨询、IT外包、软硬件应用集成与开发、产品运维及培训等业务都将在未
随着电网的不断发展,由于雷电造成的电网事故日益增多,采取有效措施遏制因雷害造成的电网事故显得尤为重要。安装线路避雷器是目前输电线路降低雷击跳闸率的最有效技术手段之
韩少功是当代作家中具有才气人情、思想历练、创新求异的“特质”的作家。他的作品曾一度在文坛中引起极大的反响,从他的新作《西望茅草地》到“寻根文学”的扛鼎之作《爸爸
投资是经济增长的主要源泉之一,投资的规模、结构和效率不仅影响经济增长的速度,还影响经济增长的质量。投资效率的高低反映投资的质量,决定经济增长的可持续性。重庆直辖以
从山地建筑空间的形式出发,分析山地建筑的美学特征,揭示了存在于理性秩序美之中的非理性的反秩序之美。
目前西安通讯消费市场接近饱和,市场格局日趋稳定。西安联通的新一轮快速发展,必须强化内部管理,明确战略定位,创新发展模式,寻求新的业务增长点。标杆管理作为70%以上财富50
随着我国医疗体制改革的深入和医疗服务市场的进一步开放,医院面临着更为复杂多变的经济、社会、政治、科技、法律乃至伦理环境的考验,医院要生存和发展,就必须对其自身的优
美国是一个农产品出口大国,其农业的巨大发展在很大程度上得益于美国不断变革的独特农业信用体系、农场主之家管理局和农产品信用公司等机构提供的巨大资金支持和金融服务。2
阶级与等级是两个不同的概念,两者有着严格的区别.等级是专制机制的产物,阶级则是宪政民主的孵化器.等级的产权依附于政治强权,形成名义上“公“,实质上皇家“大私“财产的保