大规模图的三角形和四顶点团数近似计算方法研究

来源 :辽宁大学 | 被引量 : 0次 | 上传用户:Y2J986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图作为一种数据结构,由于其丰富的表达能力,常用于复杂模型建模,如生物化学、神经生物学、生态、社会科学和信息系统等领域数据建模。在图论中,团是一个无向图顶点的子集,顶点集中每两个不同的顶点都是相邻的,也就是说,顶点集的诱导子图是一个完全图。团结构是图论的基本概念之一,在许多数学问题和相关应用领域中有这广泛的应用。随着信息技术的快速发展,图数据的规模呈爆炸性增长。以Facebook为例,截至2011年,在Facebook的社交网络中有超过7.21亿活跃用户,如把每一个用户看做成一个节点,则形成一个具有690亿个边的大规模图。面向大规模图,高效地计算三角形(三顶点团)和四顶点团,解决团计数的高时间复杂度和空间复杂度问题,正成为当前图数据处理研究领域重要研究方向之一。当前主流的团数计算方法,如矩阵相乘算法、点边迭代算法、基于图划分算法、multiple-passes算法等,普遍存在准确率偏低以及时间复杂度偏高(O(n~2)~O(n~3))的问题,针对于此,本文利用采样理论,研究了三角形和四顶点团的近似计算方法,主要内容包括:(1)提出了一种优化的基于邻接边采样的图三角形近似计算方法NSAMP-TRIANGLE。NSAMP-TRIANGLE通过改进的三角形采样(Triangle-Sample)算法完成三角形抽取,并根据单次采样成功率对图中三角形总数进行估计。然后,根据切尔诺夫界的相对误差理论,在给定三角形总数误差?和置信度?的情况下,确定采样次数k。最后,求出k次试验结果的期望值,即为最终图中三角形数量的估计值。NSAMP-TRIANGLE通过水库采样正向和反向扫描两次数据集,采样的时间复杂度降低至O(2kn),空间复杂度为O(k)。(2)在NSAMP-TRIANGLE算法的基础上,提出了NSAMP-4CLIQUES算法,实现了对四顶点团的采样和数量估算方法。针对NSAMP-4CLIQUES中四顶点团的采样成功概率低的问题,提出了有偏四顶点团采样,使得采样倾向于顶点度高的三角形,进而提高四顶点团采样成功率。NSAMP-4CLIQUES算法时间复杂度为O(2kn~2),空间复杂度为O(k)。(3)在Amazon、DBLP、YouTube、LiveJournal、Orkut和Hep-th等数据集上进行了大量的实验验证。实验结果表明,同传统的三角形计算方法相比,NSAMP-TRIANGLE的时间效率提高了20%~50%,准确率提高了5%~13%。NSAMP-4CLIQUES的运行时间平均约为40秒,准确率约为80.4%。本文所提方法适用于大规模图中的三角形和四顶点团的近似计算。
其他文献
在传统的数学教学中,老师通常是注重知识的讲解,而忽视了对学生学习能力的培养,这种教育模式已经不能适应当今快速发展的社会了。现在城市教育已经逐渐步入了课改的阶段,开始注重
介绍了专用集成电路SA4828的主要特点及其采用80C196KC单片机作为主控单元组成的高频交流调速变频器.采用智能功率模块IPM作为主开关元件,整个系统具有完善的保护功能和故障
目前国内超大型项目越来越多,对工程监理的要求也越来越高,如何做好超大型工程监理工作是监理行业亟待解决的问题。对于总监理工程师而言,提升管理能力,发挥技术水平,全面协调好内
在高度全球化的当今世界,中国的对外交流也是愈发频繁,这给翻译发展带来了巨大的机遇。口译作为翻译中笔译之外的另一种形式,也得到了各个行业的高度重视。但在我国的口译研究领域内,也存在着诸多的问题,其中最大的问题莫过于静态研究占比过大。口译的发展迫切需要却是经验性、实践性和总结性的相关研究,这就凸显了静态研究的局限性。本文是英汉模拟同声传译实践报告。选取“2018年苹果公司秋季发布会”中的英语讲话作为模
空间形状的表达与识别是地理信息科学领域的一个重要的研究方向。空间形状的相似性查询,空间形状的聚类与识别,地图要素的配准,地图综合,遥感影像的检索、提取、识别等都是空
本文旨在探讨山西民歌风格及其相关歌唱技巧问题,论文以分别来源于晋中、晋北、晋南的三首民歌《看秧歌》《大红公鸡毛腿腿》《梦梦》为研究对象,对山西民歌字腔对应关系进行
地下微孔陶瓷灌溉是将微孔陶瓷灌水器埋于地下一定深度,在工作水头较低的情况下,将灌溉水缓慢输送到作物根区土壤中的一种节能环保型地下灌溉方式。为了给微孔陶瓷灌水器结构设计和田间应用技术参数确定提供一定的科学依据,本文以微孔陶瓷灌水器为研究对象,采用室内模拟田间的试验方法进行无压灌溉,研究了土壤初始含水率、灌水器埋深和大气蒸发力对地下微孔陶瓷灌溉入渗特性的影响。主要获得如下结论:(1)相同入渗时间内,累