基于稠密网格聚类的图数据表示方法研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:vecent
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展和大数据时代的到来,人们不仅需要考虑日益严峻的数据存储问题,更要考虑如何对大规模数据进行分析和处理,从而挖掘数据中具有潜在价值的信息。图数据是社交网络、万维网和生物信息等应用的抽象数据模型,这些应用正面临着规模快速增长和形式复杂多样的巨大挑战。紧凑的图数据表示是图数据高效管理和分析的前提,不仅可以降低图数据的存储空间,而且还可以支持图数据的快速处理,具有重要的学术意义和实际价值。本文基于聚类机制对大规模图数据表示方法做了相关研究,提出了一种新型的数据压缩表示方法,主要研究内容如下:(1)提出了一种基于稠密网格聚类算法DGC。首先对现有的基于K~2-tree和K~2-BDC的图数据划分方法作了深入研究,依据这两种方法存在的无法聚类邻接矩阵中所有1值的不足,提出了基于稠密网格聚类算法DGC。该算法实现了对邻接矩阵中所有1值的聚类重组,提高了矩阵的密度。此外在此理论基础上对该算法的参数设定上做了优化处理。实验表明,对于不同类型、不同规模的图数据集,稠密网格聚类算法DGC能够筛选出图中所有的1值并将其聚类,且均有显著的聚类效果。(2)将稠密网格聚类算法DGC与K~2-tree技术相结合,提出了一种新的图数据压缩表示方法DGC-K~2-tree。首先使用稠密网格聚类算法DGC将图数据进行聚类重组,生成多个稠密的重组矩阵。然后将这多个重组矩阵表示为K~2-tree,充分压缩了图的邻接矩阵中包含的空白区域,达到进一步压缩图数据存储空间的目的。实验表明,在存储效率方面,与对比算法中表现最佳的方法K~2-BDC相比,本文方法平均减少了34.07%的存储空间。(3)在实现图数据压缩表示的基础上,提出了基于DGC-K~2-tree的图查询算法,该算法能够查询给定结点的所有邻接结点,能够查询结点间的连通性。此外,算法通过降低K~2-tree的高度,减少了查询操作的递归访问次数,进而缩短了查询时间。实验表明,在查询效率方面,与对比算法中表现最佳的方法LZ78相比,本文方法平均缩短了80.63%的查询时间。
其他文献
强制实际履行是我国合同法中规定的一种违约救济制度.本文通过对强制实际履行制度的规范分析,明确了强制实际履行的概念、性质、构成要件、适用上的限制情形等理论基础;通过
采用世界气象组织气候委员会推荐基于超热因子(excess heat factor,EHF)的热浪指标并加以拓展,对中国1958—2013年的热浪事件气候变化进行分析。结果表明:华中、华东和西北地区
文章以茶马互市为中心,主要探讨明代"以茶驭番"的治藏政策,并分析了汉藏茶马互市在治藏方面所起的作用。最后得出结论:汉藏茶马互市制度的实施,是明代有效统治藏区的关键。历
指出了南充市作为西部欠发达地区,实现精准扶贫和生态文明建设良性互动至关重要。通过实地调研、查阅文献等方法,探讨了南充市精准扶贫与生态文明建设互动问题,发现在精准扶
为了解野生大鲵在喀斯特区域的分布规律与种群历史动态,于2006年6月、2007年8、10月对长江支系沅江水域的贵州省贵定县岩下省级自然保护区野生大鲵(Andrias davidianus)种群
<正>近两年来,在全球产业持续演进的背景下,我国区块链技术和应用保持着良好的发展势头。区块链技术作为一种目前主流的分布式记账技术,利用巧妙的技术设计和数据治理方式,可
室内供暖系统的末端散热装置,是供暖系统完成供暖任务的重要部分。它向室内散热来补充房间的热损失,使得室内温度保持在设计温度或要求的温度。常见的居民建筑室内供暖系统末
一关于人及其主体性问题刘再复“主体论”的核心内容是他对人及其主体性所阐述的根本观点。它较集中表现于《论文学的主体性》,也表现于《“五四”文学启蒙精神的失落与回归
以高岭土及矿渣为原料,硅酸钠为激发剂,制备高岭土-矿渣基地质聚合物,分别采用聚羧酸、聚丙烯酸乳液两种有机高分子对其进行强化韧化。力学性能结果表明:掺入0.5wt%的聚羧酸
风湿性心肌炎致心脏停顿一例中国人民解放军264医院(030001)金德山,贾立明患者男,13岁,两周前患上呼吸道感染,自服感冒冲剂,两日来偶有胸闷,未予重视,1992年5月18日晨起后突然晕厥、口角及四肢抽搐1分钟自