基于张量分解的高效图摘要算法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:zhuanghaiyang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图摘要是图的一种简洁表示,它能够有效地解决实际应用中的大规模图数据的分析、查询和存储问题。为了计算出动态图的摘要,研究人员将动态图建模为张量,使用张量分解算法挖掘出动态图的多维信息,然后利用这些信息计算图摘要。然而,当前的许多张量分解算法往往忽视了无权图数据的二进制特性,计算得到的实值因子矩阵对于原始图数据并不具有可解释的表达性,因此本文拟采用布尔张量分解方法来进行动态无权图张量的图摘要计算。布尔张量分解由布尔矩阵分解算法演化而来,是一种面向二进制数据的张量分解算法。相比于实值张量分解方法,布尔张量分解的优势在分解结果的可解释性和稀疏性。然而,目前的布尔张量分解算法集中在静态布尔张量的分解上,而实际应用系统中的张量数据往往并非静态,而是不断地增加和累积。静态布尔张量分解算法在面对不断增长的动态张量时,效率会大幅地下降。为了解决二进制张量的增量分解问题,本文设计了一种增量布尔张量分解算法ICDBTF(Incremental Distributed Boolean Tensor Factorization)。ICDBTF算法主要分为三个过程:采样、分解与合并。通过采样方法,大型动态张量采样生成多个子张量,每个子张量并行地进入分解流程之中。最后,子张量的布尔因子矩阵依次与总张量的布尔因子矩阵进行合并,每次合并过程都可以视作一次因子矩阵更新操作。ICDBTF算法通过减小分解张量的大小和多张量分解的并行计算,极大地提高了算法的执行效率,最后通过启发式的合并策略,确保了算法的正确性。同时,本文将ICDBTF算法应用于动态无权图摘要计算流程中,设计出一种新的图摘要算法BTen Clust S(Boolean Tensor Cluster Summarization)。BTen Clust S算法利用布尔张量分解算法提升了分解结果的可解释性,同时通过增量计算提升了算法流程的计算效率。实验结果表明,ICDBTF能够在保证不损失计算精度的前提下,将布尔张量分解的计算效率提高2.2~4.6倍左右。而BTen Clust S算法相比与基线算法,能够得到压缩质量更好的图摘要结果。
其他文献
有向无环网络是一类特殊的不包含环的网络,普遍存在于生物学、遗传学、金融学等领域。社团是网络介观尺度上最突出的结构特征之一,对网络功能有着至关重要的影响。网络社团结构检测和分析已成为一个重要的主题,吸引了众多不同领域学者的关注。对有向无环网络中社团结构的检测是深入理解整个网络功能的重要途径之一。通常,由实际系统构建的有向无环网络的边具有对抗或相似两种关系。现有的大多数社团检测算法并不适用于边对抗有向
基于J-TEXT扰动场开展的一系列物理实验离不开其电源系统的支撑,而电源的实时控制系统是保证电源按照实验需求进行工作的核心。由于目前扰动场电源系统中直流电源输出能力有限,其产生的静态扰动场已经无法满足现在更高的实验需求。因此,针对物理实验对直流电源的迫切需求,本论文为扰动场电源系统中的双极性脉冲交流电源研制了一套直流运行控制系统。此外,J-TEXT正在建立磁岛偏滤器位形以施加边界扰动磁场,本论文完
随着我国长江中上游特大水电站群的建设和投运,特大型水电机组成为支撑国家能源安全和完成减排目标的关键装备。特大型水电机组设备具有单机容量巨大、转速控制要求严苛、结构复杂等特点,其安全运行对于维持电力系统稳定具有重大影响作用。水轮机调速器作为水电机组的核心控制设备,承担保障机组控制稳定、响应电网调节指令的任务。开展水轮机调速器运行状态感知和实时监控对全面掌控机组运行状态,提升机组安全、经济运行具有重要
在扩大生物质热解规模和推动其商业化的进程中,由于热解的吸热特性,传热瓶颈成为主要的挑战,而氧化热解是一种潜在的解决方案。目前关于生物质氧化热解的研究集中在不同生物质种类、不同反应器类型和规模以及不同热解工况对于热解的影响。由于氧气的引入,热解过程中存在氧-焦的异相氧化和氧-挥发分的均相氧化以及常见的焦和挥发分的二次反应问题,这使得对于生物质氧化热解的研究变得极其复杂。本文以生物质组分中含量最高的纤
镉是一种有毒的重金属,对人体的健康造成极大危害。硒是一种人体及动物必需的微量元素,作为重要的免疫增强剂,对镉具有拮抗作用,可以在一定程度上缓解镉毒害。“硒高效”油菜薹提取物具有增精、抗癌等功效,对镉毒害大鼠生殖细胞、肝脏、肾脏等有显著的修复功能,而对肠道微生物和代谢产物的影响尚不清楚。本研究利用基于16S ribosomal RNA(16S r RNA)的高通量测序技术和基于液质联用的非靶向代谢组
X射线衍射法作为研究晶体结构的主要方法,可以在不同层面上表征材料的多种结构参数,具有测量精度高、不损伤样品、快捷高效等优点。以实验装置的性质分类,X射线衍射仪可以分为同步辐射大装置和实验室尺度小装置。实验室X射线衍射仪在X射线强度上远小于同步辐射大装置,应用非常受限,而同步辐射装置的机时非常宝贵,难以获得,因此X射线衍射实验存在一个中间区域的障碍。本文针对X射线衍射实验中间区域的障碍,设计了高精度
硅(Silicon,Si)以其比容量高、对锂电位低和储量丰富等优点,被广泛认为是下一代锂离子电池中最有应用前景的负极材料。然而,电子导电性差、在充放电过程中体积变化大和界面不稳定等问题导致了硅负极较差的电化学性能。另一方面,过去研究大多以高成本纳米尺度的硅为原料,通过复杂的工艺流程制备硅基负极材料,难以进一步产业化应用。在光伏产业多晶硅片的制造过程中会产生大量的切割废料,造成严重的环境污染和资源浪
随着现代无线通信系统不断向着小型化、高集成度的方向发展,其对于射频前端模块的多功能性能要求也越来越严苛。巴伦作为平衡-不平衡电路转换器件,被广泛使用在天线馈电网络、推挽式放大器、平衡混频器等设计中。在此背景下,本文针对多功能集成化的巴伦器件进行研究,主要从以下方面展开设计:1.基于双模π型短路螺旋槽线枝节结构,分别设计了三通带和四通带巴伦滤波器。双模π型短路螺旋槽线枝节结构相较于常规短路槽线枝节而
工程实践和科学研究中的大量问题可用非线性方程组描述,如电路设计、脉宽调制策略、蛋白质结构设计等。研究如何有效地求解非线性方程组具有重要的现实意义。非线性方程组一般存在多个根,而传统数值方法往往无法同时定位到方程组的多个根。演化算法是一类基于种群的算法,具有同时定位方程组多个根的能力。演化算法凭借其良好的鲁棒性和全局性,已被广泛应用于求解非线性方程组问题。目前,基于演化算法的非线性方程组求解算法在如
超材料作为一种亚波长单元结构的人工复合材料,具有灵活的电磁调控能力,被广泛应用于雷达吸波、电磁兼容等领域。随着探测技术的进步,发展宽频带、高性能的微波吸收材料具有重要意义。本文基于谐振加合机制,设计多种渐变金属线阵列图案,构建三维超材料结构吸波体,上下层叠加设计实现吸波频带的拓宽,开展宽频带高效雷达吸波特性研究,主要研究内容及获得的结论概括如下:设计金属线结构模型构建金属-介质表面,讨论金属线附着