基于层次聚类排序的图压缩算法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:wangkaixin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图的规模越来越大,使得图数据存储以及高效执行图计算变得非常具有挑战性。无损压缩技术就是一种为减少图数据大小来适应内存的常用办法。压缩方式对于降低大规模图数据计算的成本至关重要。但是现有图数据压缩技术依旧存在压缩比低,解压开销大的问题。针对压缩比低的问题,能通过对图节点进行排序的方法挖掘图数据的局部性提升压缩率;针对计算时解压开销大的问题,选择一种新型编码方式在保证压缩效果的同时可以减少解压开销。但是现有的图节点排序算法挖掘的局部性较低或是代价偏高,导致图压缩率不高或排序时间较长。因此,本研究提出了一种新的图压缩框架,使用可以支持图应用算法直接运行的IndexedBitArrayEdges编码方式,建立了空间损失函数,提出一种挖掘边聚集度的排序算法HCSA,采用层次聚类排序,以使相似性高的节点聚在同一类中。为最小化空间损失函数,减少非空块的存储位数,提出一种使用非共同邻居数作为集合间距离的度量方式,为聚类算法提供准确测量依据。所提出的HCSA排序算法,可以较好的提高图数据的局部性,进而提高图数据的压缩率。同时在基本操作上,压缩后的图数据与稀疏矩阵存储格式具有同样的时间量级,进而保障了图应用算法的运行效率。测试结果表明,HCSA算法压缩率比Log(Graph)提高l0%~40%,比DNRGC排序算法压缩率提高10%~33%。对于BFS算法和Page Rank算法,在执行效率上比Slash Burn高10%~44%,仅在少部分图类型上略逊于Log(Graph)和未压缩原图。
其他文献
学位
学位
学位
学位
学位
化工工业是当今社会许多产业的支柱,在我国工业体系中占有举足轻重的地位,在社会经济飞速发展的今天,保障化工工业的良好发展具有十分重要的意义。然而,化工过程涉及复杂的工艺,仪器设备数量繁多,为技术人员的研究分析带来了不便。为了帮助化工从业者高效地完成化工过程的分析,攻克技术难题,本文提出通过构建化工过程知识图谱,提供一种有效全面的信息获取手段。并针对化工过程的复杂性和实时性等要求,提出了基于设计结构矩
解决我国可持续发展进程中遇到的保护、发展与福祉目标难以协调的问题,通常需要一定的政策工具创新,追求多维目标的实现。但现有围绕该问题的研究多从单一学科视角出发,难以对政策作用的机制和效果作出全面科学的评价。本研究基于新的研究理念与思路试图提出一个跨学科、多层次、多尺度的研究框架,建立政策分析、学术研究与治理干预之间互动融合的过程,并以一个研究案例为例介绍研究框架的具体应用过程。本研究所提出的研究框架
财务审计重要性水平作为注册会计师开展审计工作前应考虑的必要因素,其高低将对错报的识别及审计意见的出具产生重要影响。文章围绕薪酬水平影响财务审计重要性水平这一主题,结合股权性质所起的调节作用,以2016—2019年沪深A股上市公司为样本,从绝对和相对层面实证检验了薪酬水平与财务审计重要性水平之间的相互关系。实证结果显示,高薪酬水平往往伴随着较严格的财务审计重要性水平。进一步研究发现,不同股权性质下,
随着万物互联时代的到来,大规模的工业设备接入边缘网络,这些设备时时刻刻又在产生海量的数据,不仅使得数据采集和设备管控的规模日益庞大,还对任务处理带来挑战。网关系统融合了互联网和工业网络,完成了不同类型协议的转换,为数据采集和设备监控提供了平台。在此基础上引入边缘计算又能充分利用网络边缘端的资源进行及时的任务的处理。同时,OPC UA技术作为一种网络应用层协议栈,以其功能全面、传输安全和可跨平台的特
学位