大规模图数据的压缩和查询研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:hawkwang2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对大规模图数据的紧凑存储,能够有效的解决图数据的增长速度快导致的数据量过大问题。随着互联网络的发展和图数据在各个领域的应用,传统的图数据存储方式已经不能支持大规模图数据的存储和操作。如何有效紧凑的表示大规模图数据并且在表示的基础上支持图的基本操作,不论是对大规模图数据的管理而言,还是基于大规模图数据做数据分析和知识推理,都是一项值得研究的工作。k~2-tree和k~2-BDC能够对大规模图数据的邻接矩阵进行紧凑的表示,但仍然不能充分的压缩邻接矩阵中的0单元。为此,本文在k~2-tree和k~2-BDC的研究基础上,将聚类技术引入到大规模图数据的紧凑表示中,较好的达到了空间/时间均衡,本文的主要内容和研究成果如下:(1)综述了目前大规模图数据紧凑表示的相关经典算法,包括基于邻接矩阵的大规模图数据压缩技术,基于邻接表的大规模图数据压缩技术,基于符号计算的大规模图数据压缩技术,分析了三类算法的核心思想和适用领域。(2)针对k~2-tree和k~2-BDC存在的问题,提出了一种新的基于聚类和k~2-tree的大规模图数据紧凑表示方法——k~2-tree-cluster,该方法在k~2-tree和k~2-BDC的基础上进行优化和改进,利用网页图和社交网络图的邻接矩阵的分布规律,使用聚类算法来充分的发现该矩阵中的稠密块,然后用k~2-tree紧凑表示稠密块,来实现更加紧凑的目的。在真实数据集上Enron,EU-2005,CNR-2000进行实验,实验结果表明k~2-tree-cluster的压缩效果优于k~2-tree和k~2-BDC。(3)在k~2-tree-cluster紧凑表示大规模图数据的基础上,给出了k~2-tree-cluster的顶点邻居查询算法,包括顶点的直接邻居查询算法和顶点的反向邻居查询算法。并且对该算法进行了实验验证。在真实数据集上Enron,EU-2005,CNR-2000进行实验,实验结果表明k~2-tree-cluster的顶点邻居查询时间优于k~2-tree和k~2-BDC。
其他文献
非洲猪瘟(ASF)缺少安全有效的疫苗,目前仅能靠感染猪扑杀和生物安全措施进行控制,因此快速、准确诊断十分重要。血清学检测是ASF实验室诊断和流行病学调查的重要手段,世界动物卫生组织(OIE)推荐的检测方法主要有酶联免疫吸附试验(ELISA)、间接免疫荧光试验(IFA)和免疫转印试验(Western blot)。其中,ELISA所用抗原从非洲猪瘟病毒(ASFV)感染细胞提取,只能在ASF参考实验室进
氨是世界上年产最多的无机化合物之一,同时也是生产化肥和重要化学原料的中间体,在国民经济发展中占据着举足轻重的地位。工业上广泛使用的传统Haber-Bosch,操作条件苛刻需要高温高压,工艺单程转化率较低、能耗高,并且会产生大量温室气体等,亟待开发温和条件下绿色合成氨技术。电化学合成氨能够在电能的作用下打破氮气活化热力学能垒,在常温常压下能够实现由水和氮气合成氨,从而备受广泛关注。本文分别以活性炭(
超密集网络(Ultra-Dense Network,UDN)中基站密集化部署,网络流量大幅提升,UDN成为第五代移动通信技术(The Fifth Generation,5G)的关键技术之一。然而,UDN中密集部署的基站导致干扰更加严重;同时,UDN中用户数目的增多导致无线资源更加紧缺,传统的无线资源分配方案不再适用。因此,UDN中的干扰问题和无线资源分配问题限制了 UDN网络流量的增长。为了进一步
能源问题是关系到一个国家经济发展的战略问题。当前世界各国的能源主要来自于煤炭、石油等化石资源。然而,化石资源储量有限,是不可再生的资源,并且在利用化石资源时不可避
随着社会发展需求的变化以及高等教育的普及,全国高校招收的本科生、研究生数量激增。这些学生群体在国内各区域间因求学而产生人口流动行为。我国国土广阔,各地理区域间的文化依然存在着较大差异。在新的文化和环境中,不同区域文化的碰撞与交融产生的影响在这些学生身上表现得尤为明显,这些都直接影响着他们的学习和生活。近年来,国内外关于跨文化适应虽有一定的研究,但更多关注留学生的跨文化适应,而针对国内流动学生群体的
移动互联网媒体深化的背景下,微信公众平台的兴起和发展,改变了当前的信息传播方式和人们的生活方式。高校作为主流机构,也纷纷入驻微信公众平台,实现信息发布、服务师生、思想宣传、文化育人等诸多综合功能。用户群体庞大且稳定,传播到达率和效率都较高,微信公众平台是高校实现传播形式创新的完备手段。但高校微信公众平台在实际传播运营过程中,影响力仍存在提升空间。为更好地提升高校微信的传播影响力,从而实现高校建设,
概念隐喻理论认为,作为一种广泛存在的语言现象,隐喻不仅是一种修辞方式,更存在于人类的思维和认知中。概念隐喻理论提出后,关于不同话语体裁中隐喻如何影响思维的研究应运而
随着网络技术的发展,越来越多的消费者参与到网络购物的行列中来,带动了电子商务的飞速发展,电商评论机制也愈发完善。消费者在进行网购行为之前,都会参考已有的产品评论,以此降低购买风险,从而促进购买决策。传统的产品评论是由顾客购买完产品后自发地生产而来,以生产者为导向。随着评论数据激增,消费者难以从中快速寻找到目标信息。评论内容的非结构化,以及信息量的增加,增加了消费者信息处理的难度。同时,虚假评论层出
媒介化社会的到来提醒我们应当关注以新技术为本质特色的媒介实践。而短视频作为新兴的低门槛、强视觉媒介,已经逐渐影响到社会生活的方方面面,并发展成为一种全民参与的文化实践。本文通过实地考察四川大凉山彝族地区“悬崖村”青年的移动短视频实践,试图从“可见性”(Visibility)的维度深描和理解短视频和悬崖村青年深度“互嵌”的过程。本文认为,我们不应只将短视频理解为信息传播的新形态,还要看到它作为草根“
近些年,随着卫星通讯技术的高速发展,卫星通信节点渐渐具备了相当的信息处理能力和信息转发能力。对比于地面的传统网络,卫星网络有着通信传输距离远、覆盖区域面积广泛以及不受地形因素影响等优点,在以后的通信系统中显得愈发重要。在卫星通信系统中,相较于高轨(GEO)卫星系统和中轨(MEO)卫星系统,低轨(LEO)卫星系统的优点是可以实现全球无缝覆盖、较低的传输时延以及更好的星间链路质量等,成为了卫星网络研究