重叠社区多层线图映射的Spark应用实现

来源 :吉林大学 | 被引量 : 0次 | 上传用户:lqlq329807
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着七桥问题的迎刃而解,人们对于图论的研究也逐渐兴起。由于网络应用图模型来进行研究可以更加清晰明确,因此,在社会网络、生物网络、信息网络等方面,图论有着广泛的应用,而社区发现又依赖于图论。在日常生活中,存在着形形色色的与社区相似的组织机构,比如班级、城镇、省市等。互联网兴起后又出现了虚拟形式的社区。对社区的相关信息进行挖掘已然成为现如今各领域中的十分热门的研究方向。根据是否有重叠节点这一特性,可以将社区分为重叠社区和非重叠社区。在日常工作生活中,重叠社区最为普遍,非重叠社区出现的概率相对小很多,所以学者们对于重叠社区的研究较为广泛。但是对于非重叠社区的研究又为重叠社区的研究提供了理论基础,很多重叠社区发现方法是基于非重叠社区发现方法提出来的。Palla等人首先发现并提出了社区重叠现象,并提出了一种用于重叠社区发现的方法。此后,应用于重叠社区发现的算法不断涌现,比如基于团渗透的社区发现算法、基于点聚类的社区发现算法、基于边聚类的社区发现算法等等。在基于边聚类的社区发现算法中,Link SCAN算法由于其将普通的图映射成连接空间图,将原始图中的结构联系准确地传递到经过映射后的连接空间图中,使得聚类的效果更真实,能够更加清晰地对重叠社区进行划分。传统的LinkSCAN算法只对原始图进行一次映射,并在其基础上进行聚类操作。本文提出的Multi-LinkSCAN算法在传统算法的基础上,通过自定义的方式,能够对原始图进行多次映射,在最终层数的连接空间图上进行聚类,使得社区的划分效果更加精准。但是LinkSCAN算法和Multi-LinkSCAN映射后所得到的连接空间图中,点和边的数量,呈指数级别的增长,这使得在求相似度矩阵、欧式距离以及聚类过程中的时空复杂度较原始图高出很多,导致运算时耗激增。此时通过应用分布式并行计算框架Spark,对大矩阵相乘、邻接交互矩阵、邻接相似度矩阵、欧式距离、层次聚类这五个方面的求解进行分布式的改进,以此来提高运算效率。同时本文采用阿里云E-MapReduce产品进行Spark集群的搭建,其在易用性、成本、资源整合、安全方面均优于普通的Spark物理集群搭建,为实验提供了良好的平台基础。
其他文献
微分代数方程(DAEs)在许多科学和工程领域都有广泛的应用.多年来,寻找可靠的数值解法一直是计算数学方面的基本课题.本文在微分求积法(DQM)的基础上,采用Lagrange插值函数,以
现代人类随着生活水平的提高,对纺织品的热湿舒适性提出了更高的要求,单向导湿织物由于其对水分的单向传导效果能够显著提高织物热湿舒适性,大量对单向导湿机织物与针织物的研究随之出现,但是在单向导湿非织造布上的研究依然较少。本课题聚焦单向导湿针刺复合非织造布,以粘胶纤维、细旦涤纶纤维、十字截面涤纶纤维、高吸水性涤纶纤维为原料制备了四种单层针刺纤维网,然后以针刺加工方式分别制备了不同克重的十字截面涤纶/高吸
澳大利亚亚维州于2016年设立VCE“语言与文化组”考试,将语言教学与文化教学并行,标志着中国文化教学在维州汉语国际教育中的比重会越来越重,甚至会发展成为一门独立的学科。为了研究坎布瑞学院文化教学情况,帮助该学院提高文化教学效果提出实用的教学建议,本文将从语言和文化的关系谈起,分析其如何在文化教学中将二者融合的角度出发,对坎布瑞学院的文化教学内容、学院文化教学策略、四个文化教学案例和端午节文化活动
拓扑结构在拓扑学研究中占有重要的位置.1997年,A.Csaszar首先给出了广义拓扑的定义,且获得了它的一些很好的性质.自此许多学者开始了对广义拓扑的研究,并且得到了许多有用的
本文主要研究了有限交换环上加权exceptional单位的表示以及研究了伽罗环GR(p2,p2m)上对角二次型解的个数.在第一章中,我们主要介绍了有限交换环和伽罗瓦环的相关知识、excep
目的:研究雌激素缺乏不同时间段阿尔茨海默病(Alzheimer’s disease,AD)模型小鼠脑内糖代谢及学习记忆的改变,以明确雌激素缺乏促进AD发生发展的潜在分子机制。方法:对3月龄
拟插值是函数逼近的重要方法之一,相对于插值和最小二乘拟合方法,拟插值的方法不需要求解大型线性方程组,其在CAGD(计算机辅助几何设计),数值PDE(数值偏微分方程),计算几何等诸多
近年来,中国对烟草行业中采购管理工作提出了较高的要求。四川中烟长城雪茄烟厂积极响应国家政策,要求对自身的采购管理情况进行分析总结,拟通过建立采购管理信息化平台(以下
释意理论是国际口译界出现的第一种系统的口译理论,把口译研究从语言结构的静态分析转为对意义传递过程的动态考察。释意理论建立的口译程序是:理解源语、脱离源语语言外壳、用目的语表达理解了的内容和情感。释意理论认为:口译的对象是意义而非语言,口译过程中译员通过自己的语言知识和言外知识理解源语的意思并在目的语中表达出来,达到脱离源语语言外壳的结果。本文以2019四川省第二届家庭教育高峰论坛模拟会议为例,分析
从上个世纪末到二十一世纪的第二个十年,科技的发展已经极大的推动了人类的进程,其中,互联网技术的发展空前繁荣。我们当前所处的时代,正是“互联网+”的时代,教育、农业、商