不确定图上的结构聚类算法研究与实现

来源 :深圳大学 | 被引量 : 0次 | 上传用户:zhiming0077
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的迅猛发展,图结构越来越广泛地被应用于各行各业的数据挖掘和分析中。图结构抽象了事物之间的关系与联系,为人们的研究分析提供了便利。结构聚类作为一种重要的图结构数据的分析挖掘工具,不仅可以找出网络中稠密连接的簇,还可以识别其中的离群点与中介点,从而更好地理解图中各点的角色与它们之间的关系。现有的结构聚类研究主要是针对确定图的,即图上的点与边都确定存在。然而在科学研究与现实生活中,由于种种原因,许多的关系存在不确定性。例如社交网络中受个人隐私保护影响的不确定关系、生物网络中受实验因素影响的不确定关联、移动点对点网络中受环境影响的不确定连接等。这些不确定性通常需要使用不确定图(概率图)来表征。为此,需要考虑不确定图上的结构聚类问题。然而,现有的确定图上的结构聚类算法往往不能准确地表征不确定图上的连通关系。因此,在本文中,我们提出了一个不确定图上的结构聚类算法问题,目的是找出一个给定的概率图上的可靠结构聚类,并给出了它的形式化定义。在此基础上,设计并实现了一个不确定图上的结构聚类求解算法。具体地,本文首先对不确定图上的结构聚类算法问题的定义进行了研究。分析总结了现有的确定图上结构聚类问题模型,从而推广出不确定图上的结构聚类算法的问题定义。不同于确定图上的结构聚类,本文的结构聚类问题依赖于一种全新定义的概念——可靠结构相似度。可靠结构相似度度量了概率图上两个节点之间的结构相似的概率。从而可以用一个概率来衡量节点之间的相似性。随后,由于可靠结构相似度的求解是一个比较困难的问题,直接求解具有很高的时间复杂度,是不可取的。为此,本文详细分析了可靠结构相似度的求解过程,并在此基础上设计了一种基于动态规划思想的求解算法。该算法能够快速地求解可靠结构相似度问题,在该算法的基础上,本文根据目前最好的确定图上结构聚类算法,设计出不确定图上结构聚类算法框架。为了进一步加快我们算法的速度,我们设计了多种强有力的剪枝和优化措施。最后,我们使用了五个真实的数据集对我们所提出的算法进行了较为全面的研究与分析。通过与现有聚类算法的比较,我们的算法可以得到更好的不确定图上的聚类。同时,通过性能分析,我们验证了优化措施的有效性。综合实验的结果,得出我们的算法能够有效且高效地完成不确定图上的结构聚类问题。
其他文献
高空长航时无人机留空时间长,飞行高度高,要求自主导航系统具有较高的精度和可靠性。捷联惯导系统自主性好,但误差随时间累积;全球定位系统的位置精度高,但信号易受干扰;天文
随机系统的控制一直以来都是控制界研究的热点前沿之一,目前大多数的研究基于高斯线性系统。但实际的工业系统往往是非高斯的,而对于非高斯系统,传统的基于方差最小化的控制
合成孔径雷达(Synthetic Aperture Radar,SAR)能够全天时、全天候地对海洋环境进行观测,是海面舰船目标检测的有效手段。但是在复杂自然背景、弱小目标、低信噪比场景以及存
GDP的核算方法一般有三种,生产法、收入法和支出法,后两种较为常见。现阶段中国统计局披露GDP的方法为,分省份上报数据,然后进行简单加总,初次披露后再进行修订。世界银行(Wo
聚丙交酯(PLA)由于具有良好的生物可降解性和生物相容性,在生物医学、制药学等领域用途广泛。目前,以金属配合物作为催化剂(引发剂)催化(引发)丙交酯单体开环聚合,得到的聚合
我国股市在数十年的发展中,股票数据呈现出爆炸式增长、复杂多样、噪声多等特点,利用单一的内部因素数据进行股市分析无法对股票数据进行充分利用从而满足实际需求。因此,本文利用神经网络对股市中多种形态的外部信息加以研究,主要工作内容如下。首先以神经网络的自适应、自学习能力以及鲁棒性为基础,向神经网络中开创性地加入随机扰动噪声层来应对股市中随机波动型外部信息的干扰。随机扰动噪声层与以往隐藏层噪声数据添加方式
随着社会的进步与发展,数字图像在人们的生产和生活中得到了广泛的应用和传播,使得人们对于图像的清晰度要求越来越高。但是,由于生产成本、制作工艺、设备环境等外在因素的
钻井岩屑是石油开采时产生的废料经过无害化处理后的产物,虽已达到环保标准,但处置时会占用大量土地资源。随着我国石油开采力度的不断加大,钻井岩屑造成的环境污染和资源浪
随着国际航运经济及科学技术的发展,VTS在海上交通运输中的地位与日俱增。VTS性能评估研究已经成为众多VTS管理人员日益关注的课题。当前,国内外研究VTS性能评估的文献较少,
现有的蜂窝网很难满足用户指数增长的通信需求。基于融合无线广播网与蜂窝网的热点业务推送技术是个有效的解决方法。本文研究了无线融合网中热点业务推送关键技术,具体分为