基于变分自动编码器的社区发现及异常点检测方法研究

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:a15968331849
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社区发现技术可以挖掘网络中的子结构,是了解和分析复杂社会结构的宝贵工具。通过社区发现技术可以揭示原始网络中隐蔽的社区结构,从而分析复杂网络的潜在特征。社区发现的主流算法是基于网络的拓扑结构来探索社区,但是在Facebook等真实社交网络中,由于垃圾邮件或钓鱼账户等异常的连接随处可见,虚假的节点属性和拓扑结构给社区发现带来影响,若不及时发现甚至会扩大谣言或病毒的传播。同时,随着近年来数据信息的爆炸式增长,社区中的特征降维也成为网络中的重要研究课题,近年来引起了很多学者的广泛关注。但是,基于社区降维所开发的大多数算法都利用了经典理论,结果耗费了大量时间却对复杂网络效果不佳。因此,要正确认识社区结构,发现对社区聚类影响的异常点很重要。同时应用高效的数据降维方法对提高社区发现质量具有重要意义。为此,本文提出基于变分自动编码器的社区发现及异常点检测方法。第一,基于图嵌入的方式提出无监督的异常点检测方法,有效结合社区连接结构和属性特征,降低异常点对总损失函数的贡献,从而优化图嵌入总损失函数。第二,基于ktrnss找到社区的核心结构,通过对不同数据集核心结构的搜索可以初始限定k值的范围。一方面保证了社区的核心结构,另一方面也加快了后续K-means和K-medoids聚类搜索k值的速度。第三,为了适应目前不断增长的大型网络,克服“维数灾难”带来的问题,应用变分自动编码器降维,最小化重构误差和KL散度损失求得最优解,与此同时,有效利用本地信息和社区信息训练深度学习模块,获得网络中每个顶点的降维表示。第四,分别基于K-means和K-medoids对得到的低维数据聚类从而获得准确的社区发现。与现有同类型的5种算法依次对比实验,基于Fsame,NMI和模块度Q三个评价指标分析社区发现的质量,在Strike、Football、LiveJournal和Orkut四个数据量悬殊的数据集上得到的实验结果都表现出较为不错的优势。
其他文献
本文研究了两类神经元模型,其中一类是哺乳动物的新皮层神经元模型,此类神经元受到十多种离子电流的相互作用,其神经元模型的动力学行为十分复杂.为便于从数学上进行研究,本
与普通混凝土相比,高强混凝土具有较高的抗压强度、较大的弹性模量,同时也不可避免的存在着明显的脆性和较差的横向变形能力。高强箍筋约束高强混凝土是一种被普遍认可的改善
随着信息化教学的不断普及与推进,整合技术的教学已然成为当前教学的常态化形式,这对新时代教师的知识结构提出了新的要求,即教师对TPACK的理解掌握须进一步深入。因此现开展
随着计算机技术的发展,数据已经成为企业的核心竞争力。为了使数据创造出更大的价值,企业着手建立数据平台,为用户及数据管理人员提供数据共享、数据处理等服务。数据在平台
液晶是一种重要的材料,液晶材料具有高强度,高模量,良好的阻燃性,耐热性,电光效应,热光效应以及各向异性等多种优异的特性.因此它的用途非常广泛.比如,液晶材料可用于制作计
图像的特征检测、描述和匹配作为图像处理的基础对于许多计算机视觉技术及应用的发展至关重要。传统二维图像只能聚焦在场景中的某个固定深度,场景中其他深度的目标模糊不清
级联H桥STATCOM具有可扩展性强、耐高压、模块化程度高、实时补偿无功功率等优势,在无功补偿领域具有广阔前景和应用价值,成为国内外电力系统的研究热点。STATCOM的H桥相互独
随着忆阻器的发展,人们的生活水平在不断的进步。忆阻器在日常电路中扮演者不可或缺的角色。因其具有记忆功能,被认为是模拟人脑神经突触的最佳电路元件。近几年来,由于忆阻
在信息时代,人们希望计算机能像人类一样智能地感知对方的情感,实现有效的人机情感交互。传统意义上的通过表情、声音等单一模态信息来分析人的情感往往具有一定的局限性和不
汉麻纺织品具有吸湿、快干、防霉、抑菌、抗静电、抗辐射、防紫外线等优异性能,被誉为是“被埋没的黄金”。但是,它在当代纺织服装行业的产品开发和推广中遇到了许多问题和瓶