Louvain算法在社区挖掘中的研究与实现

来源 :中国石油大学(北京) | 被引量 : 0次 | 上传用户:hnsushiheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
日新月异的互联网、云计算等网络信息技术给人们的生活带来了翻天覆地的变化,人们已经逐渐踏入了大数据时代。呈指数级增长的海量数据不仅为新兴的互联网企业,更为传统行业带来了机遇与挑战。网络的复杂度与规模不仅考验着现有的IT架构,也为计算机的计算能力提出了严峻的挑战。在网络社交平台盛行的今天,各大社交网站每天都会产生上TB级别的数据。传统的单机运算难以满足海量大数据处理,随着分布式计算框架的发展,并行计算技术逐渐成熟,已经能够有效解决计算瓶颈,为海量大数据挖掘提供技术支持。从社会网络方面研究入手,社会网络的研究关键在于节点间的关系与社会属性。现实表明,真实的社会网络都呈现具有社区结构的特性,社区发现就是通过网络中节点间的连接关系挖掘社区结构的过程。Louvain算法是一种基于模块度优化的高效算法,除了时间上的优势,还能探测到层次的社区结构,不会遗漏一些小型的社区。在研究Louvain算法的基础上,针对算法耗时问题,提出了并行化的改进思想进一步对算法效率进行优化,同时保证算法的精度不变。分布式计算框架的发展推动了分布式计算的应用,但是社区发现算法在分布式计算方面的应用却很少。面对具有海量数据的大规模复杂社交网络,利用分布式计算框架能进一步提高算法的运行效率,社区发现算法与分布式计算框架的结合必是社区发现未来的研究热点。Spark分布式计算框架对社区发现算法这类需要大量迭代计算的算法有着很好的适应能力。将改进后的算法在Spark分布式平台上实现,进一步提高了运行效率。针对分布式计算中不同计算节点之间消息传递滞后产生的社区互换等问题,提出了连通图的方法加以改进。
其他文献
煤炭企业顺应"去产能"的国家宏观经济政策导向,改进经营战略,创新运营策略,必须大力实施技术经济一体化的对策,着力提高自身的供给能力、供给质量和供给效率,才能夯实转型升
2010年7月,经过长达数月卧薪尝胆的研发,CBD项目终于面世了。它的出现,将南航的营销服务提升至精准化的新高度,昭示着南航高端服务的未来。一、CBD——旅客行为数据库随着服
破产管理人制度是企业破产程序的核心部分。现就我国的破产管理人制度展开论述。
对光纤液体浊度仪的工作原理做了概述,并进行了硬件和软件设计,系统硬件设计采用最大限度复用,提高系统的效率,软件设计采用了分层化的系统设计理念。此浊度仪简单易用,在实
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
民办学校的大力发展,为广东经济发展、政治文明、文化繁荣、社会和谐做出了卓越贡献,同时也为民办学校教学质量的提高带来了挑战,因此对民办学校进行教学质量评估、规范民办学校
为了提升小学生的阅读能力,文章从三个方面探究了信息技术在小学阅读教学中的运用,具体包括利用信息技术,帮助学生理解阅读内容;利用信息技术,培养学生多维能力;利用信息技术
文章对多功能副词“才”表短时义的范围进行了界定,认为“才”的短时义可区分为单纯短时义和情态短时义。并将短时义副词“才”的意义分为三个层级,论证了“才”表示说话人认为
作为视觉重要组成部分的色觉在屈光发育中的作用应引起我们的重视。有研究发现,不同单色光与眼球的增长发育和屈光的变化密切相关,长波长光能促进眼球的增长形成相对近视,短
【正】 这次会议开得很好,很及时。做好国有企业下岗职工基本生活保障和再就业工作,是由我们党全心全意为人民服务的根本宗旨所决定的,直接关系到广大职工群众的切身利益,关