面向大规模图数据的挖掘分析算法研究

被引量 : 0次 | 上传用户:zhujunhong778
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着社交网络的大力发展和图数据表达的广泛应用性,图数据的规模呈爆炸性增长,这对大规模图数据挖掘分析提出了巨大挑战。现阶段都是采用大规模图数据处理系统对图数据进行挖掘和处理。然而,现有的大规模图数据挖掘处理技术大部分都是离线批处理的,对高效的图数据挖掘分析技术研究较少。本文正是以这个思路为出发点,提出了基于Arbor的高效图数据挖掘分析编程模型。本文研究了图数据库和大规模图数据处理系统,提出了基于Arbor的高效图数据挖掘算法编程模型,利用该编程模型和MapReduce实现了大规模图数据挖掘分析中重要算法:PageRank算法、单源最短路径算法和广度优先遍历算法,最后搭建了实验测试环境,在数据集上对上述三个算法从运行时间、内存消耗上进行了全面的性能评测,并与开源系统Hama、迭代式处理系统Spark进行对比。实验结果证明:基于Arbor的图算法性能明显优于开源系统Hama、Spark、Hadoop。本文提出的基于Arbor的高效图数据挖掘分析编程模型,也可以用于基于Arbor的其他数据挖掘算法的实现中。本文设计和实现的重要的图数据挖掘分析算法:PageRank,单源最短路径和广度优先遍历算法,可以用于社交网络中社区发现,网络舆情分析等。
其他文献
近年来,随着经济全球化的到来和市场竞争的加剧,制造企业面临新的机遇和挑战,世界发达国家的制造业企业不断向劳动力成本低的发展中国家转移,而中国则以其丰富的物质资源和低
随着全业务运营的临近,IP城域网的建设越来越受到移动运营商的关注,本文主要探讨在移动IP城域网建设的背景及意义,以及如何建设好移动IP城域网。
比较了张拉膜和充气膜的异同。基于非线性有限元UL格式,进行充气膜的形态分析和荷载分析,分析中考虑了充气膜的特殊之处。建立了充气膜的优化设计模型,以工程造价为目标函数
信息技术的发展带来学习方式的变革。移动终端设备的普及和Web2.0的广泛应用将微型学习带入人们的视野。本研究以微型学习理论为指导,以微信这一普遍的SNS应用为载体,研究大
期刊
在新课程实施的背景下,本文对湖北省普通高中体育课堂有效教学情况进行深入的调查分析,得出体育教师在高中体育课堂教学中还需要进一步的地把握新课程标准,要提高体育课堂有
《小说的时间形式和时空体形式》是一篇重要但长期被忽略的比较文学理论文献。通过汲取维谢洛夫斯基的历史诗学资源,巴赫金将历史方法和美学沉思结合起来,从而在历史类型学的
曹雪芹在《红楼梦》这一著作中,成功的塑造了许多栩栩如生的人物形象。其中王熙凤这一人物形象是真实、丰满、鲜活的的结合体。美艳亮丽,八面玲珑,机敏聪慧,风趣诙谐,爱慕虚
本研究对以裙带菜为原材料的褐藻酸钠的最优提取方法进行了筛选和鉴定。结果表明裙带菜褐藻酸钠的最佳的提取条件为:提取溶液1%Na2CO3,提取温度60℃,提取时间1h;漂白剂溶液Na
“再”语义分析──并比较“再”、“又”史锡尧“再”,《辞源》释义为“两次”、“第二次”;举例为《书经》的“朕言不再”(我的话不说两次)、《左传》的“一之为甚,岂可再乎?”(一