论文部分内容阅读
大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。介绍了Hadoop、Spark两种不同类型的大数据平台,提出了折衷的大数据分析平台——图计算。分布式图计算系统Gemini采用了稠密-稀疏双模式的计算模型、基于chunk的图划分方法、局部性感知的Chunking等技术。Gemini的内存占用约为Power Graph的六分之一,意味着可以用更少的机器获得更快的分析速度,降低用户大数据分析的成本。