聚类分析及其在社交网络中的应用研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:hunanlyq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析作为一种无监督学习方法,是机器学习领域重要的研究方向之一,已经成功应用到金融、商业、社交网络、生物信息学等领域。目前存在大量成熟有效的聚类算法,其中基于图论的谱聚类算法,具有能够划分任意形状数据、易于执行等优点,受到广泛的关注。然而,谱聚类算法的计算复杂度和空间开销比较大,对大规模数据集来说是难以承受的计算负担。另一方面,以互联网为代表的信息技术的快速发展,导致社交网络研究需求越来越迫切。利用聚类手段分析现实中的社交网络,已经成为一种重要有效的研究方法。本文研究谱聚类算法的可拓展性,并将改进的谱聚类算法应用到大规模社交网络的社区检测中,主要的研究内容包含以下四个方面:(1)针对多数谱聚类算法通常以距离决定数据之间的相似性导致聚类效率低的问题,提出了一种公理化模糊共享近邻自适应谱聚类算法。首先结合公理化模糊集理论提出了一种模糊相似性度量方法,利用识别特征来构造更合适的相似度矩阵,然后采用共享近邻的方法根据每个点所处邻域的稠密程度自动调节尺度参数,进一步提高聚类准确率。仿真实验表明:相较于距离谱聚类、自适应谱聚类、模糊聚类方法和地标点谱聚类,改进算法能取得更好的聚类效果。(2)针对谱聚类算法用于大规模数据集时存在计算复杂度过高的问题,提出了一种加权PageRank改进地标表示的自编码谱聚类算法。首先选取数据亲和图中权重最高的节点作为地标点,以选定的地标点与其他数据点之间的相似关系来逼近相似度矩阵作为叠加自动编码器的输入。然后采用基于KL散度的聚类误差来同时更新自编码器的参数和聚类中心,考虑重构误差减少嵌入表示空间失真对聚类造成的负面影响。实验结果表明,该算法能有效降低算法复杂度,较好适用于大规模数据集。(3)针对多数半监督谱聚类算法不能有效利用约束信息,仍需要对所有数据的拉普拉斯矩阵进行特征分解的问题,提出了一种基于不完全Cholesky分解的半监督谱聚类算法。首先使用不完全Cholesky分解思想选择相似矩阵中有限的列和行,使得相应的稀疏数据集很好地表示完整的数据集,获得近似相似度矩阵。然后使用近似相似度矩阵改进约束谱聚类的目标函数,提高半监督谱聚类算法的可扩展性。实验表明,改进算法相较于其他几种半监督谱聚类算法具有更好的聚类性能。(4)当前基于聚类算法的社交网络社区检测,仍然要进行矩阵分解,较高的复杂度难以用到大规模社交网络数据集。针对该问题,结合前面所提的改进谱聚类算法,将其应用到大规模社交网络的社区检测中。实验结果表明:所提算法用到大规模社交网络的社区检测中,在保证社区划分准确率的同时提高了社区划分的效率。
其他文献
随着半导体材料研究的快速进展,光电化学(PEC)传感器也获得了快速的发展,但是PEC传感器在用于实际分析时也面临着巨大挑战。主要是生物样品中的非目标物(蛋白质、多糖甚至细胞等
随着城市化进程的不断加快,旧城改造、拆迁、扩建等工程项目越来越庞大,使得具有安全高效、经济环保等优点的拆除爆破技术成为拆除行业的首选技术。但是,随着拆除爆破建筑的
输电塔结构是一种在输电系统中被广泛应用的高次超静定空间结构。随着我国经济和现代化的不断发展,输电系统已经成为国家经济发展的生命线,它的安全可靠性越来越受到重视。输
70年波澜壮阔的中华人民共和国奋斗史,也是马克思主义中国化在理论与实践结合中深入推进的发展史,更是中国共产党总结执政经验并深化对马克思主义理论、社会主义建设以及人类
近年来,随着全球环境污染问题日益严峻,风能作为一种清洁可再生能源受到各国广泛重视,得到迅速发展和利用。然而,风能的随机性和波动性会对电力系统的可靠性造成重大影响,并
随着我国经济的高速发展,政府的大力投入,扶贫政策的深入实施,偏远山区公路建设在不断增多。隧道选线存在着许多不可抗力的因素,有时所选线路施工过程中会遇到这样或那样的问
潜水器是进行海洋探索、参与国际竞争、提振国家实力必不可少的战略设备。同时潜水器也是多个领域的交叉产品。我国在潜水器研究领域有着卓越的成果,如潜龙一号、潜龙二号与
近年来,随着隧道工程施工技术发展的越来越成熟,公路与铁路的建设在路线选择上更加多元化,由原来的避山绕路到现在的凿山取直,隧道工程发挥着重要的作用。但是东北地区冬天寒
多智能体系统近年来成为控制领域和人工智能领域研究的一个热点问题,其中系统的一致性问题具有广泛的应用价值,被大量学者所关注。本文在一致性研究的基础上,充分考虑到系统
长期以来,我国始终坚持积极主动的开放战略,主动对接国际惯例,营造公平竞争环境,不断创新对外投资方式,优化对外投资结构,稳步推进对“一带一路”国家投资,积极在全球各国并