基于核与特征选择的谱聚类社区检测算法

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:lilyzhanglove
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类的思想在人类的历史发展中始终存在。信息社会的到来,大量的数据信息需要处理,以便发现知识。信息的交流与传递,在现实生活中形成了许多复杂的网络,这些网络是由社区构成的。对这些网络社区的研究具有重要的意义。网络社区结构往往具有社区内节点联系紧密,社区间节点连接稀疏的特点,这是典型的聚类特征。因此,聚类的方法可以运用在复杂网络的社区检测中。经典聚类方法是针对特定的数据结构,不具备全局特性,谱聚类算法具有全局特性。本文在谱聚类算法研究的基础上,使用了一种新的构造相似度矩阵的方法,能够提取更多原始数据的特征,兼顾数据的局部特性。然后用基于熵的方法对特征向量进行选取。最后用这些特征向量所张成的空间聚类。提出了一种基于核与特征选择的谱聚类算法。并将其运用在复杂网络的社区检测中。具体工作如下:(1)在相似度矩阵构造上,以往的谱聚类算法是通过构造单一的相似度矩阵进行特征分解,而本文则是构造一组相似度矩阵来得到关于数据的更多信息。在以往研究的基础上分析了核k-means与谱聚类之间的关系,用相似度矩阵的拉普拉斯矩阵作为核矩阵,然后通过核选取的方法进行特征提取。同时把local scaling的思想用在了相似度矩阵的构造中来强化数据的局部特性。(2)在特征向量选取上,不是直接选取特征值大的特征向量,而是采取了一种基于熵的特征向量选取方法。首先,计算各个特征向量的熵,根据其对整体熵的影响程度,对其进行排序,选择那些对整体熵影响大的特征向量来聚类。(3)本文把上述提出的基于核与特征选取的谱聚类算法,运用到社区检测当中去。用邻接矩阵构造一组相似度矩阵,通过核选取的方法进行特征提取后,用基于熵的方法对特征向量进行选取,最后运用这些特征向量完成聚类。并在人工数据及真实数据集上进行测试。
其他文献
蛋白质通过某种机制进入细胞器或亚细胞器,这个过程为完成它们各自特殊的功能提供了一个适合的环境。因此,蛋白质的功能与其亚细胞定位之间有着密切的联系,确定一个蛋白质的亚细
电化学生物传感器是用来识别和定量分析生物体的一种测量技术,目前在电分析化学等前沿领域应用较多,电化学生物传感器因其制造简单、价格低廉、灵敏度高、选择性好等优点,已被广泛研究并逐步应用于环境检测、临床医学、食品工业等领域。随着纳米科技的不断进步,纳米材料在催化、生物医学、微电子、能源等领域已被广泛应用。如碳纳米管,纳米二氧化钛、纳米金等纳米材料用于电化学传感领域,可以提高化学催化活性,加快反应速度,
学位
相同遗传背景下甘蓝型黄籽油菜具有黑籽油菜所不能比的一些优良性状:种皮较薄、没有色素积累或色素积累很少、种子含油量高且油质好、饼粕蛋白质含量高、纤维素和多酚含量低及饲料利用价值高。 从甘蓝型黄籽油菜初次选育到现在经历了几十年的时间,然而甘蓝型黄籽油菜的黄籽性状遗传不稳定这难题还没有得到很清楚的阐述。它一直阻碍着甘蓝型黄籽油菜的育种进程。为此,各国育种专家及相关领域的学者从遗传学、生理生化及分子
本文通过野外观察与室内实验相结合的方法,对雪莲(Saussurea involucrata (Kar. et Kir.) Sch. –Bip.)的生境、发育解剖学、胚胎学、繁育特性及幼苗生长特性进行了研究,并就其对特殊环境的适应性及其致危的原因进行了探讨,主要结果如下:(1)雪莲是一种典型的多年生一次结实的高山植物。在天山,该植物一般生长在高山带砾石质土壤及悬崖峭壁的石缝中。其生境气候多变、昼夜温
本文作者利用Ty1/copia-like类反转座子反转座酶的保守位点设计引物,从人参和西洋参基因组中扩增得到长度为240bp左右的PCR产物.对扩增产物进行分离和克隆,并随机挑选了80多
流水线型ADC因为高速高精度特点,被广泛应用于便携式通讯产品、高清视频图像产品等领域,成为国内外研究的热点。比较器和MDAC构成了流水线ADC单级模块,它们的性能好坏直接影响整
压缩采样(Compressed Sampling,CS)理论是一种新的信息获取与处理的理论框架,已成为信号处理领域的一个新热点。在目标探测和雷达成像等许多应用中,雷达数据都被证明是可压缩的
  本研究以细胞信号转导学原理为依据,结合植物生理学与分子生物学、生物化学及植物病理学有关最新研究进展和方法,从一氧化氮(NO)及相关信号分子诱导植物信号传导功能为切入
计算电磁学(CEM)方法在诸多电磁场与微波工程问题中有着极为广泛的应用。随着电磁场理论在工程中的不断应用和发展,多角度激励和电大尺度目标的分析一直是计算电磁学发展的重