多属性无向加权图上的聚类方法研究

来源 :黑龙江大学 | 被引量 : 0次 | 上传用户:liongliong510
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会信息化的推进和通讯技术以及网络技术的飞速发展,信息的流量越来越庞大,存储的数据量正在以指数速度迅速增长,图是一种广泛使用的数据结构,它能很好地表示数据对象之间的结构关系。在现实世界中,诸多系统以网络图的结构形式存在,如因特网、万维网、人际关系网、科学家协作网和电话网等等。同时用于描述真实世界网络结构的图的规模也具有较大的增长趋势。目前面对浩渺无际的数据,人们迫切需要从数据汪洋中去粗存精、去伪存真,通过技术手段分析得到有用的结果。图聚类是一个非常有趣和具有挑战性的研究课题,近年来已经引起众多研究者的广泛关注,并应用到多个领域。图聚类的目的是按照各种不同的标准把大型图的节点拆分成不同的簇,使得同一簇内的节点连接紧密,不同簇之间节点的连接稀疏。许多现有的图聚类方法主要关注图的拓扑结构,使得每个簇达到一个有凝聚力的内部结构。但是在实际应用中由于图结构数据集的异质性,图本身存在着诸多的潜在信息,如图节点的属性信息和节点间的权重信息等等。随着图结构数据集的日趋庞大和复杂,仅仅分析图的拓扑结构信息很难得到理想的聚类结果。为此本文在综合考虑图的拓扑结构、节点属性以及节点间权重的基础上提出了两种新的图聚类方法来解决上述问题。1.多属性网络图结构化凝聚层次聚类方法图聚类的目的是按照各种不同的标准把大型图的节点拆分成不同的簇。该方法综合考虑图的拓扑结构和节点属性信息,利用节点的属性信息辅以图的拓扑结构产生新的簇,避免了传统图聚类方法的单一性。该方法首先通过在原图上添加多个属性节点的方法来增强同属性节点间的紧密度,同时可以让非连通图变为连通图;再根据节点的直接邻居关系计算边的结构化相似度,为了提高新添加的属性节点的贡献,本文计算属性节点转移概率矩阵,由此得到相邻节点间的相似度值。该方法只访问图节点和边各一次、简单、高效。2.基于最大最小距离度量的加权网络图结构化聚类方法该方法统一考虑图的拓扑结构和节点间的权重,使具有较大权重边连接的两点不被分开、同时使聚类结果的拓扑结构划分明显,即从图的拓扑结构上讲同一簇内的节点连接密集,不同簇间的节点连接稀疏,避免了传统方法的单一性。为此我们提出基于最大最小距离度量的加权网络图结构化聚类方法,归一化处理每一条边上的权重,按照图的拓扑结构计算具有直接边相连的节点的结构化相似度,综合考虑图的拓扑结构和权重各自的贡献,以最小关联度原则选取新的聚类中心,再以最大关联度原则进行模式归类。
其他文献
建模和仿真技术日益成为研究复杂系统的主要手段。针对科学研究和产业领域的热点问题,涌现出大量仿真框架、模型、组件和工具等,其中既有通用的底层工具集,又有面向特定领域
随着手机智能化和网络化的趋势,人们对手机的要求也在不断提高。然而智能手机技术的不断发展使得手机用户在体验多样化服务的同时,所面临的安全威胁也在不断升级。本文选择目前
基因组重组在物种进化过程中发挥重要作用。基因组重组研究中的一个基本问题是计算一个基因组转换为另一个基因组所需的重组操作的最少个数,它被称为重组距离问题。反转和移
计算机和网络技术的迅猛发展,引发了工业控制领域深刻的技术变革.CAN总线支持分布式控制和实时控制,但不适合远距离传输.工业以太网的确定性、实时性和本质安全性已经得到很
自然语言处理已经成为世界各国和各民族信息技术发展过程中至关重要的研究课题之一,伴随着如今大数据时代的到来,更加体现了它的学科优势性,成为了每一个民族信息处理的核心问题
在当今的信息化社会中,人们的日常活动同计算机的联系日益密切。与此同时,包括计算机病毒在内的恶意程序与恶意代码也时时困扰着计算机用户。此外,用户有意或者无意的操作也
随着计算机技术及微电子学的蓬勃发展,嵌入式系统与无线传感器的应用越来越广阔。本文在学习了大量定位系统以及传感器研究成果的基础上,深入分析和比较了几种典型的定位技术
一所大学的新闻系向新闻界调查记者的成长道路,新华社原社长、著名记者郭超人当时对其中一个问题的“三问”是这样回答的:问:什么样的人不能当记者?答:多数人能想到、能做到
5月8日,欢庆“08奥运”文化活动影像大赛在北京奥运新闻中心正式拉开帷幕。此次大赛旨在通过以影像为载体再现社会各界举办的“欢庆奥运”文化活动,充分展示广大人民群众对奥
三网融合就是广播电视网、电信网、互联网之间的融合,三网融合是现阶段的一个必然发展趋势,其应用范围是非常广泛的,已经在环保、智能交通、公共安全、政府工作、平安家居等