【摘 要】
:
随着互联网的应用和科学技术的不断进步,各行各业的数据正以前所未有的规模不断积累。图作为描述数据的重要数据结构被学者们广泛应用于大数据研究,图数据挖掘问题成为学术界重要的研究课题。在大规模的图数据中,图的密集部分往往是图数据中的重要部分,因此,发现大规模图数据中的密集子图成为目前研究的一个热点问题。并且,密集子图问题又可以广泛应用于频繁子图问题,社区发现等问题中,具有重要的研究意义。发现图数据中的密
论文部分内容阅读
随着互联网的应用和科学技术的不断进步,各行各业的数据正以前所未有的规模不断积累。图作为描述数据的重要数据结构被学者们广泛应用于大数据研究,图数据挖掘问题成为学术界重要的研究课题。在大规模的图数据中,图的密集部分往往是图数据中的重要部分,因此,发现大规模图数据中的密集子图成为目前研究的一个热点问题。并且,密集子图问题又可以广泛应用于频繁子图问题,社区发现等问题中,具有重要的研究意义。发现图数据中的密集子图问题是一个著名的NP-难问题。目前已经有一些学者设计了不同的方法来发现密集子图,但其中存在不适用于处理大规模图数据、发现的密集子图不连通、密集子图是局部最优解、算法不适用于在某种类型的图数据中发现密集子图等问题。为解决以上问题,本文利用分布式Hadoop平台强大的存储和计算优势,设计了一种适用于处理不同应用背景下的大规模图数据的密集子图发现算法。本文的密集子图发现算法通过HDFS来实现大数据集的存储,通过MapReduce来实现大数据集的计算。算法首先对图进行预处理,排除图中平行边和环对密集子图发现的影响。其次,为快速地发现大图中的密集子图,使用图剪枝策略快速移除一定不存于密集子图中的顶点,然后在剩余图中提取只包含在三角形中的顶点构成的子图。最后,选择初始子图并通过两个阶段不断对图进行更新,第一个阶段:在每次迭代中从当前图中顶点的邻居节点集中选择一个顶点,使得加入该顶点之后的子图密度最大,直至当前图中顶点的邻居节点集不再有顶点使得子图密度变大时终止迭代。第二个阶段:在每次迭代中,从当前子图中选择一个顶点,使得移除该顶点之后的子图密度最大,直至子图的密度不再增大时终止迭代。本文将此时的子图视为算法发现的密集子图,并且利用Spark平台的优势使用弹性分布式数据集RDD来分析图的连通情况。通过实验表明,本文提出的分布式环境下的密集子图发现算法在处理大规模图数据的运行时间上、发现的密集子图的密度上、密集子图的连通情况上取得了良好的效果,与其他算法对比具有一定的优势。
其他文献
在哺乳动物早期肝脏和胰腺的形成过程中,两者由同一内胚层的前体细胞发育而来,且在一定的条件刺激下可以实现转分化。在肝脏损伤中有检测到胆管周围的细胞表达lgr5,lgr5阳性
通过电化学介导原子转移自由基法(eATRP),在碳纤维上(CFs)接枝了2D结构的聚甲基丙烯酸缩水甘油酯前驱膜,并在其上原位修饰L-天冬氨酸,形成了3D结构的螯合碳纤维复合物(CCFs);其后,依次原位电沉积镍铝层状复合金属氢氧化物(Ni/Al-LDHs)和亚铁氰化镍(NiHCF),形成了可用于回收水溶性铯(Cs+)的功能性复合材料(NiHCF/NiAl-LDHs/CCFs)。采用电化学、FT-I
地震物理模型数据采集中一般都使用压电超声换能器作为震源和接收器,由于实验室换能器的频率和尺寸的限制,使得用换能器作为震源和检波器时和野外实际震源存在着一定的差异,
随着社会和经济的发展,抗生素广泛应用在人类医疗、畜牧业和水产养殖等方面,大量的抗生素通过排泄物和废水的方式排放到自然水体中,对环境造成了严重的污染,残留在自然水体中的抗生素随着食物链进入到人体中,损害人们的健康。因此,寻找高效、绿色环保的去除抗生素的方法是非常迫切和必要的。光/光电催化技术是一种潜力巨大的新兴降解技术,具有快速、高效和绿色环保等特点。本文设计和制备了三维牡丹花状CoO@β-Bi_2
进入二十一世纪,我国经济结构转型升级的步伐迅速加快,绿色经济、循环经济己经成为我国经济社会发展的重点。一方面,随着社会经济的不断向前推进,人民物质生活和精神生活都有着很大的提高,人们关注的不仅仅是衣食住行,对环境质量的关注度也在随之增加,环境问题成为当下社会关注度极高的问题。另一方面,全球温度普遍升高、雾霾天气增多、暴雨大风频繁等极端天气使得人们更加注重环境的保护,倡导蓝天白云。当前我经济社会的发
近红外活性材料因其具有独特的物理化学性质,在肿瘤诊疗中表现出良好的应用前景。本篇论文中我们通过简单的一步法合成了具有近红外吸收的BSA@Cu2-xO NPs。该纳米粒子不但具
随着自旋电子器件不断向微型化方向发展,磁性纳米颗粒的尺寸也进一步减小,当铁磁性颗粒的尺寸低于超顺磁临界尺寸时,其组成的器件就丧失了磁存储的能力。交换偏置效应能增加铁磁纳米颗粒的磁各向异性,突破超顺磁临界尺寸的限制而受到广泛关注。铁磁/反铁磁复合纳米颗粒的交换偏置效应除了受铁磁层厚度、反铁磁层厚度、界面粗糙度等因素影响外,反铁磁材料中的微观结构如缺陷也是决定性能的重要因素。目前发现交换偏置效应的磁性
目前对复杂地质构造成像的主要手段是叠前深度偏移,叠前深度偏移需要比较精确的速度。全波形反演技术能够给偏移提供精细的速度,但是常规全波形反演存在计算量大、效率低等问
目前研究较多的光催化材料多是以二氧化钛为主的氧化物半导体,这些材料的禁带宽度较大,对太阳光的利用率较低。四元硫化物半导体光催化材料--铜锌锡硫(Cu2ZnSnS4或CZTS)是一种
层状碱金属钛酸盐材料作为一种具有很强的离子交换性能的新型纳米材料,不仅在催化、离子交换、单电子晶体管等方面有着巨大的应用前景,而且作为一种污染物吸附材料,能够高效地去除溶液中的污染物。和其他的离子交换剂相比,钛酸盐纳米材料的制作过程更加环保,所消耗的电能和热能相对较低。本文主要研究不同方法合成不同结构的钛酸盐纳米材料对水溶液中的铀酰的去除行为,考察了钛酸盐纳米材料在吸附核素方面的影响因素以及其在实