量子聚类及其在社团检测中的应用

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:king5440
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘技术是近年来在人工智能、信息决策及数据库领域研究的热点之一。在众多数据挖掘分析工具中,聚类分析是一种最常用、最有力的工具。聚类分析的目的是将抽象出来的对象或样本集合根据相似度划分成若干具有特殊意义的团或者类,从而更好地理解和分析数据,发现样本的潜在分布结构。迄今为止,人们提出了大量聚类算法。但随着数据规模(包括样本个数及数据维度)越来越大,而先验知识相对匮乏,传统的聚类算法效果并不尽如人意。受量子力学启发,量子聚类(Quantum Clustering, QC)将聚类问题作为一个物理系统,在波函数已知的情况下,通过求解薛定谔方程式(Schr dinger equation)导出势能函数,从势能能量点的角度来确定聚类中心。作为一种基于划分的无监督聚类算法,量子聚类能够克服传统方法的一些缺陷,如对初始值和噪声敏感,聚类类别数需要事先给定等。为了进一步提高数据的聚类精度和运算效率,本文在传统量子聚类基础上做了相关的改进工作。由于复杂网络的社团检测与数据的聚类分析具有一定的相似性,量子聚类同样可以应用于社团检测问题研究。本文所做的主要工作如下:(1)通过研究了量子聚类的基本理论及特点,提出了一种利用核熵主成分分析的量子聚类算法。为了获取数据的潜在结构,采用核方法将原始数据映射至高维特征空间,并用熵值为评价标准筛选特征向量,以获得核熵主成分。为了增强算法的局部特性,同时提高算法的运行效率,在量子聚类算法中引入K近邻策略,并通过梯度迭代获得最终的聚类结果。通过实验分析,不论是聚类效果还是鲁棒性,该算法远优于其他对比算法,尤其是对线性不可分数据集。(2)在对已有的复杂网络社团检测算法进行深入研究的基础上,将量子聚类应用于复杂网络的社团检测问题研究中。首先为把网络转化为适合聚类分析的数据结构,构建了结构相似度矩阵,度量网络中节点之间连接关系的强弱。同时,在量子聚类过程中,引入节点的邻接信息,在提高算法局部分析能力的同时,降低算法的时间复杂度。(3)针对大规模复杂网络的社团检测问题,借鉴小规模社团检测解决方式,综合考虑检测精度和运算效率两方面的因素,提出了两点改进策略以增强量子聚类算法对大规模网络社团检测的处理能力。该算法采用网络层次划分方法,将原始大规模网络划分成若干个较小的子网络,并在子网络中构建相似度矩阵。此外,采用Nystr m方法逼近结构相似度矩阵的特征向量,进一步提高算法的运行效率。仿真结果表明,该算法能够取得较好的检测效果,且运算时间较之于原来的算法大大降低。
其他文献
自从在Co-TiO薄膜中发现了室温铁磁性以来,过渡族金属元素掺杂氧化物稀磁半导体材料成为自旋电子学领域新的研究热点。但是各研究组对于材料的室温铁磁性是否是内禀属性,以及铁
建设项目实施实行招投标属于《中华人民共和国招标投标法》发展实施的必然结构,其中2013年我姑八部委制定的《电子招标投标办法》、《电子招投标系统技术规范》将传统招投标
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
自1859年达尔文提出自然选择是进化的机制以来,物种形成和适应性进化一直是进化生物学研究的核心问题。迄今已对物种形成和适应性进化开展了大量研究工作但其遗传机制仍未得
近年来城市建设加快,大规模工程越来越多.大体积混凝土施工技术是当代工程建设的常用技术,因此要保证工程质量,避免在工程中出现质量问题.本文主要探究建筑工程施工方法,同时
学位
表面等离子体共振(SPR)技术作为一种新型的生物传感技术,能够实现对生物分子无标记、实时动态检测,近年来受到了越来越多的关注,已经成为生物传感领域的研究热点。 本文给出
极化合成孔径雷达(Polarimetrie Synthetie Aperture Radar,POLSAR)是一种先进的成像雷达系统,具有通道多、参数多的特征。与单极化SAR图像相比,极化SAR图像包含更丰富的地物信
在现在激烈的市场竞争中,质量是企业立足的根本,也是企业长远发展与进步所必须重视的因素.建筑行业的工程质量在很大程度上取决于商品混凝土的质量,而商品混凝土的质量又取决
随机共振是噪声和周期信号作用于非线性系统,信号和噪声在非线性系统的协同作用下,发生噪声能量向信号转移产生的一种现象。利用随机共振原理可提高系统输出高信噪比达到识别弱