基于增量的不确定社团发现算法研究

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:quickz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,在全球信息化大潮的推动下,社会网络得到快速发展,各种不同的社会网络都表现出一种强的社团效应。一个网路中的成员趋于形成密切联系的社团。在不同的应用下,这些社团也被称为模块,簇等。总体上,社团内部联系紧密,社团外部联系稀疏。如何快速、准确的发现网络中的社团(即社团发现)仍然是一个关键问题。从是否考虑数据的不确定性,社团发现可分为确定社团发现和不确定社团发现。很多传统确定社团发现算法都依据全局信息进行社团发现,算法效率不高,并且没有考虑到数据的不确定性。然而在现实应用中,网络中的数据往往存在其内生的不确定性,网络中数据存在残缺现象、数据以一定概率存在等,这里称为不确定网络。从不确定网络中进行社团发现的算法称为不确定社团发现算法。本文充分考虑了确定网络和不确定网络,结合社团局部特征和数据本身特点,对社团发现算法进行了深入研究。本文主要工作及创新点如下:(1)对LFM(Largest Fitness Measure)算法进行改进。深入分析了局部社团发现算法LFM算法以及势能模型,在此基础上提出了LFM算法的改进算法—WLFM算法。该算法利用势能的思想对LFM算法中随机选取初始节点、划分准确性较低、算法结束条件难以达到等问题进行改进,最后通过两组实验验证了该算法具有良好的准确性和较高的效率。(2)对EM(Expectation Maximization)算法进行改进。首先对高斯混合模型的EM算法进行详细介绍,接着对此算法进行优化。利用势能的方法对高斯混合模型的EM算法进行初始化,得到优化的初始值。通过两组实验证明新的算法具有较低的错误率。(3)提出不确定相对K紧密子图发现算法。研究发现,寻找前K个最紧密子图具有较高的复杂性。本文研究了从不确定图中发现存在概率较高的前K个紧密子图问题,提出了不确定相对K紧密子图发现算法。在算法中,由不确定图的连通指数确定阈值,接着根据阈值计算子图的存在概率,最终得到存在概率较高的前K个紧密子图。最后,通过若干组实验,验证了此算法可以高效、准确的发现不确定图中的紧密子图。
其他文献
网络蠕虫经常被用来盗取用户的私人信息、毁坏用户的系统和发起DoS攻击等,给网络安全造成了严重的威胁。近年来,随着P2P网络应用的不断增加,P2P蠕虫也随之迅速发展起来。由于P2P
随着移动终端设备的普及和它各种性能不断提高,人们对移动终端设备的依赖性逐渐增加,不再满足于移动终端设备简单的通信功能,而是希望移动终端设备能像普通电脑一样,通过无线通信
随着计算机技术的快速发展,语音合成技术也得到快速的发展并逐步渗透到社会生活的各个领域。但现阶段汉语语音合成中还存在一些问题,主要体现在输出语音的可懂度和自然度上。本
随着网络技术的发展和信息交换的日益频繁,信息安全技术的研究变得越来越重要。密码学发展几千年来,在社会上应用非常广泛,20世纪80年代,非线性混沌理论开始发展并且日益壮大。混
随着信息化进程的加快和网络技术的进步,人们对网络的依赖性日益提高,随之而来的安全性问题也日益严峻。在互联网环境下计算机有害程序的种类和数量急剧增加。这些有害程序利用
航迹规划是实现飞行器自动导航的一项关键技术,它是随着信息技术和航空技术的不断发展而发展起来的一门跨学科的课题研究。由于飞行器的飞行环境异常复杂,约束条件众多,航迹规划
大自然中的植物种类多样,千姿百态,它们是组成和谐大自然不可缺少的一部分。虚拟植物建模融合了计算机图形学、应用数学、随机化过程、物理学、植物学、农学及可视化计算等多
量子计算是一门交叉于数学、物理与计算机科学的前沿学科,具有令人期待的发展前景.量子计算的研究主要分为对量子计算模型、量子计算复杂性和量子算法的研究.目前,广泛引起学
伴随着互联网技术飞快的发展,一种新型的技术——云计算技术已经被广泛应用于各个领域。云计算是相继分布式计算、网格计算及并行计算之后又一大新领域的突破。云计算实质意
基因芯片技术是目前研究人类基因组和其他各种模式生物基因组复杂性的最强有力的工具,这一技术已经广泛地应用于生物学和医学的各个领域。但是随着基因芯片技术的不断发展,产生