多层图分析技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:ytlytl1009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,越来越多的领域都使用“图”来表示和管理数据,称为“图数据”。针对图数据的分析可以发现其中的结构特征、频繁模式、演变规律等有用的知识,具有重要的科研意义和应用价值。随着研究的深入,人们发现现实世界的图数据往往包含数据对象间多种类型的关系。例如,社交网络数据包括多个社交媒体组成的网络;交通网络数据涵盖了多种交通工具组成的网络。这种图数据称为“多层图”,其每一层包含了数据对象间某种特定类型的关系。多层图分析可以发现准确可靠、价值更高的知识。然而,多层图分析面临两方面的挑战:一方面,单层图上的计算语义在多层图场景下不再适用,多层图上的计算语义更加复杂;另一方面,多层图分析涉及多个图层上的计算任务,使得问题的固有计算复杂性大大增加。现有的多层图分析方法在计算语义和算法设计两个方面都存在缺陷,不能很好的解决多层图分析的有关问题。本文综合运用数据分析的相关理论、技术和方法,对于多层图分析进行了系统研究。本文同时考虑了无概率的普通多层图和带概率的多层图,从图数据的稠密性、可靠性、传播性和相似性四方面重要性质出发,对多层图分析领域中的一系列重要问题进行了深入研究,主要研究成果如下:1.本文研究了多层图上的多样化稠密区域发现问题,该问题在生物蛋白复合体检测和社区发现上具有重要应用。在无概率的普通多层图模型基础上,本文提出了一种新的稠密区域概念d-Coherent-Core(简称d-CC),设计了两种近似比为1/4的高效搜索算法来求解该NP-难问题,算法在结果质量和执行时间两个方面均优于基于准团的传统算法。d-CC概念同时刻画了稠密区域的稠密度和支持度两方面重要特性,满足唯一性、包含性和层次性3个重要数学性质。自底向上和自顶向下两种搜索算法采用了高效的搜索策略和剪枝方法,分别适用于支持度参数较小和较大两种情况。真实数据上的实验结果表明:自底向上和自顶向下两种搜索算法是高效、准确的。2.本文研究了多层图上的top-k可靠顶点搜索问题,该问题在通信网络中具有重要的研究意义,相比基于阈值的搜索问题自适应性更好。本文给出了一种图层带概率的多层图模型,提出了一种新的多层图计算框架——共享计算,其可以有效利用多层图不同图层间的重叠结构以减少搜索代价、提高算法效率。基于此,本文设计了求解top-k可靠顶点搜索问题的共享BFS精确算法和随机算法。真实数据上的实验结果表明:共享BFS精确算法具有很高的效率和扩展性;共享BFS随机算法具有很高的准确率。3.本文研究了多层图上的影响力最大化问题,该问题在病毒式营销和舆情控制中应用广泛。为描述影响力最大化问题中的图数据,本文给出了一种带概率的多层图模型,其可以表示由于边的不确定性而形成的多层图。针对已有算法的缺陷,本文设计了一种能够同时达到高时间效率、高结果质量、低内存开销和高健壮性的影响力最大化算法,具有线性的时间和空间复杂度。该算法采用高质量的分数估计方法和增量式的分数更新方法,在实际社交网络中表现出良好的性能和很高的扩展性。4.本文研究了多层图上SimRank顶点相似性测度问题,该问题是推荐系统、实体识别等众多应用的基础。在带概率的多层图模型基础上,本文严格给出了符合其可能世界语义的SimRank相似性测度定义,设计了高效、准确的计算顶点间SimRank相似性的方法。同时,作为SimRank相似性测度的基础,本文提出了多层图上随机游走的定义,严格证明了这一定义满足马尔可夫性,设计了计算随机游走概率的高效算法。真实数据上的实验结果表明:本文提出的SimRank算法是高效、准确的;本文提出的SimRank测度比传统测度在实际应用中效果更好。
其他文献
《马尔特手记》是里尔克唯一的一部小说,由71节独立的片段构成,如同马赛克彼此错落。马赛克式的叙事风格和打破常规的诗性语言使其成为了最杰出的现代德语小说之一。小说内容由三部份构成:主人公马尔特在大都市巴黎的经历;童年生活的回忆;书中的历史人物。20世纪80年代末,在跨学科、跨文化的研究诉求之下出现了“空间转向”,对空间的认知和理论不断得到丰富。列斐伏尔的《空间生产》对“空间转向”的推动更是不容小觑。
本报告基于模拟汉英笔译项目,以《2017年全球人工智能人才白皮书》为翻译文本。文本语言平实,表述客观,偏专业化,科技类术语较多,句式复杂,尤以多重复句突出。该模拟项目旨在
在全球经济金融形势复杂变化、人民币汇率双向波动趋势加剧的背景下,涉外企业面临着的经营环境更趋复杂。企业通过财务运作规避风险(或获取收益)的需求不断扩大,同时也加大了
医院全面预算管理的实质是建立约束机制,医院管理层对预算管理认识的高度决定了预算管理工作的深度,通过实施预算工作能够提高工作效率。本文以陕西省某省级公立医院开展预算
“传统产业不接触互联网,就会失去难得的转型发展机会.”深圳市农产品股份有限公司总裁胡翔海表示,“互联网经济最需要大数据,而深圳农产品股份有限公司拥有这么多的全国实体
2017-07-08,宁夏金昱元化工集团在固原盐化工循环经济扶贫示范区一期20万t/a高性能特种树脂项目和循环化改造项目已建成,7月中旬投入试生产,至此,公司在示范区基本形成煤—电
目的针对膝关节骨折术后患者运用护理干预所取得的效果展开分析。方法参与本次研究的对象为2016年1月至2017年1月在我院进行医治的膝关节骨折患者110例。采取随机分组的方式
随着时代的进步,金融业信息化的程度越来越高,电子商务也随之兴起,银行业在传统金融的基础上纷纷融入信息化高科技的各类互联网技术,有助于银行业的信息交流与金融服务。因此各大银行开始跨行发展电子商务,建立综合性电商服务平台。但建行善融商务平台在实际运营过程中,由传统金融业务向电子商务互联网金融转型虽然取得了一定的成果,但核心产品与金融产品创新力度的不足,营销渠道拓展与促销活动开展的不足,定价机制过高的顾
中小企业在社会生活和国民经济的发展中具有十分重要的作用。蓝海战略理论不同于传统的中小企业发展理论。在综述传统中小企业发展战略的基础上,本文介绍了蓝海战略的理论框架
本文系统地介绍了基于Matlab/Simulink建立在直接转距控制系统中的定子磁链仿真模型。通过仿真可以观察异步电动机在启动和加载的情况下转速、电磁转矩、定子磁链和定子电流