高效图计算框架关键技术研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:kantstop
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图结构具有很强的表达能力,现实世界中诸多实体以及实体之间的联系可以抽象成图中的顶点和边,通过分析图数据来挖掘有价值的信息,具有重要的现实意义。近几年来,图数据迅速增长,网页搜索、社交网络、生物信息等领域图建模早已达十亿甚至千亿规模。并且,图本身呈现的幂律分布和随机访问等特性,使得在图数据处理过程中很难利用时间和空间局部性。以上问题为设计高效的图计算框架带来了严峻挑战。单机图计算框架以其能够充分利用计算和存储资源、线程间通信更加高效以及编程简洁易懂等优势,逐渐成为研究热点。本文围绕图计算面临的诸多难题,针对单机上高效图计算框架的设计与实现开展了深入研究,主要工作和创新点如下:1.基于闪存的冗余阵列构建方法。闪存相对磁盘具有高带宽、低延迟、随机读写性能好等优势,为了进一步缩短与内存之间的性能差距,为图计算提供高速外部存储,我们探究了高速闪存阵列的构建方法。我们分别选用SATA和PCIe两种接口的固态盘,组成了RAIS0,5和6三种模式下的闪存阵列。然后,分析了队列深度和请求粒度对单块固态盘和闪存阵列性能发挥的影响,测试了挂载四种主流文件系统XFS、EXT4、F2FS和Btr FS后单盘和闪存阵列的性能表现差异。最后,总结了如何针对上层应用IO特性来构建高速闪存阵列以及优化IO的方法。2.基于NUMA架构的外存图计算框架HPGraph。目前服务器一般拥有多个处理器并以NUMA架构互联,处理器访问本地内存的性能要远远高于远端内存。因此,我们设计实现了一种适配NUMA架构的外存图计算框架HPGraph:针对NUMA特性的数据划分和访问模式能够尽量减少远端内存的访问;细粒度的edge_block过滤策略,可以有效减少外存IO访问量;并且,使用work-stolen机制保证线程间负载均衡以充分利用处理器的计算资源。除此之外,我们构建了高速闪存阵列作为HPGraph的外部存储,进一步缩短图数据处理时间。大量实验表明,HPGraph相比于同类图计算框架GridGraph最高可获得约130%性能提升。3.基于众核处理器的内存图计算框架Ants。相对于多核处理器,众核处理器拥有更多的计算核心,能够提供更强的并行计算能力。同时,众核处理器上计算核心之间的网络互联更加复杂。在KNL服务器上,我们设计实现了基于众核处理器的内存图计算框架Ants,主要针对异构内存和cache-false sharing问题进行了一系列优化工作。实验表明,我们设计的数据划分机制能够很好的发挥异构内存各自的优势,任务调度策略有效降低了cache-false sharing问题导致的网络通信和内存访问开销。相比于同类计算框架Ligra,Ants取得了最高约9倍加速效果。更进一步,我们在多核服务器上验证了所提出的任务调度策略的适用性和有效性。4.基于内存的快速Truss分解算法pTD。Truss分解在图挖掘领域扮演着重要角色,通过对Truss分解步骤的深入分析,我们发现算法初始化阶段和分解阶段的三角形查找过程极为相似,基于此,提出了一种基于内存的快速Truss分解算法pTD。pTD将分解阶段的三角形查找上移来对图中每条边的support值进行初始化,同时保存查找结果供分解阶段使用,以此达到减少计算量、缩短处理时间的目的。由于中间结果数据规模较大,我们构建了高速闪存阵列作为外部存储,并使用计算IO重叠机制进一步降低外存IO开销。通过真实数据集上的测试,pTD相对于经典Truss分解算法最高能够取得约5倍的加速效果。
其他文献
随着集成电路规模不断扩大,芯片上晶体管的集成度越来越高,芯片测试越来越困难,测试数据量越来越大,测试成本越来越高。如何提高测试压缩率,降低测试成本成为集成电路测试应
滑坡、崩塌、泥石流等地表形变灾害给人民的生命及财产安全造成了巨大的损失。地基边坡雷达可以实现对地表形变灾害的连续高精度监测,这对于预报地表形变灾害,从而降低灾害对
国家间的竞争归根到底是人才的竞争。在科技日新月异、人才流动国际化的时代,为抢占知识经济发展制高点,世界各国纷纷采取强有力措施吸引并留住高层次人才。面对激烈的国际人才竞争和多样化的人才流动格局,我国实施开放的国际化人才政策和机制,初步形成了多层次、多渠道、多形式、精细化、相互衔接的人才引进格局,吸引了越来越多的优秀人才回国工作。本研究重点关注中国引进的海外学术人才,选取1-6批化学学科“青年海外高层
自“大众创业、万众创新”提出以来,社会上涌现出越来越多敢想敢干的创业者,他们试图充分整合已有资源,努力创造更多的社会价值。然而,随着竞争对手的加入和传统企业的转型升级,新创企业所处的创业环境不确定程度进一步提高,激烈的竞争也促使技术不断更新迭代,外部环境日益严峻起来。在此背景下,以创业团队为创新主体的新创企业必须积极投身创新实践,努力适应环境的变化,通过内外部的组织协作提升团队创造力。团队创造力是
机体滚动轴承是飞机机械设备支承和维持转动的关键基础零部件,轴承的性能直接影响着飞机运行过程中的安全性与可靠性。很大程度上,滚动轴承的性能取决于轴承材料特性,轴承套圈的硬度和残余应力等参数的梯度分布直接影响其服役寿命,且这种分布特性与套圈滚道淬火工艺密切相关。而感应淬火工艺具有加热平稳、效率高、可对工件需要加热的部位选择性加热以及节能、环保等诸多优势,满足轴承套圈淬火要求。但是感应淬火是一个涉及到电
随着三维扫描、图像处理以及标准CAD模型表达技术NURBS的迅速发展与广泛应用,通过三维扫描技术将获取到的高精度STL模型向通用CAD模型之间转换的需求更加突出。因此,提出研究
高速公路的建设拉近和密切了城市间的距离,打破了城乡间的隔阂,带动了沿线区域经济的发展,然而,高速公路规模的迅速扩张,导致了资本需求的急剧增加,除去政府资金配置后,高速公路企业的投资现金流无法覆盖所有投资,仍存在较大的资本缺口,加重了企业的债务负担,高速公路企业不能按时支付施工单位工程款的事件时有发生。为保证高速公路行业持续健康的发展,本文根据国家的相关政策和文件,着眼于高速公路企业,将债转股这一政
药物缓释材料是缓释体系的重要组成部分,可调控药物释放速度,提高药效,然而在制备过程中可能产生较大能耗,因此寻找可以负载药物、生物相容性好且制备能耗低的缓释材料成为研究热点。新疆特色植物——罗布麻具有天然抗菌性能,可制备成高长径比和高比表面积的纳米纤维素(CNF);沙棘提取物天然无毒,可以降低滥用抗生素而产生的耐药性,将两者通过乳液静电纺丝负载,制备高生物相容性且缓释效果优异的新型抗菌生物材料,为开
我国山地、高原面积广大,山区面积占到国土总面积的69%,因此山区道路成为我国道路交通系统的重要组成部分。而配备有传统自动变速器的车辆在坡道行驶时往往会在动力性、安全
聚乙烯(PE)管材近年来被广泛应用在市政给排水和城市燃气管道系统,而慢速裂纹增长(SCG)是PE管材发生脆性破坏的主要原因,若燃气管道破裂则会引起燃气泄漏会造成严重的人身危险和财产损失,故管材耐SCG性能是评判其能否长期使用的重要指标。目前,传统的SCG试验普遍存在试验时间过长问题,限制了对PE管材耐SCG性能的准确评价,降低了 PE管材的开发速度。对此,国外学者提出了快速评价方法-全切口蠕变试验