基于深度学习的社区发现方法

来源 :天津科技大学 | 被引量 : 0次 | 上传用户:yangminfeng_1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息技术的发展和普及将人们带入了一个网络新时代,生活中越来越多的系统都可以抽象成为复杂网络,复杂网络的研究也成为了信息领域的热点。社区结构是复杂网络的重要特征之一,发现复杂网络的社区结构有助于对网络特性和隐含规律的探索,因此具有重要意义。本文介绍了复杂网络的概念和研究现状,对不同类型的社区发现算法进行了总结分析。其中K-means聚类算法由于其思想简单、易于实现、适用于各种类型的数据,在社区发现中得到了广泛的应用,但该算法对复杂网络的高维性和稀疏性并不敏感,社区发现的结果并不理想。因此本文在经典聚类算法的基础上,运用深度学习建模,充分利用网络中的先验信息,针对链接型和融合型复杂网络分别提出了改进的社区发现算法。主要包括以下内容:(1)针对链接网络提出一种基于深度学习的无监督聚类社区发现算法deep-CLCD。提出了一种新的节点相似度计算方式,根据节点之间的距离关系和邻居节点构建特征矩阵;面对网络结构的复杂性,本文运用深度学习方法的非线性映射能力,将网络的有效特征提取到低维空间;用聚类算法返回结果。(2)针对链接网络提出了一种主动地半监督聚类社区发现算法ESCD。本文将传统的K-means算法进行分步计算;将每一步的距离迭代结果视为粗聚类结果,并根据粗聚类结果计算节点隶属度;通过主动地添加先验信息完成网络的重构,使网络结构更加清晰。(3)针对内容与链接融合的网络提出了一种基于深度学习的社区发现框架CGLCD。利用节点的文本内容指导网络的拓扑结构重构,提出一种文本和链接融合的方式,设定最小和最大阈值以成对约束的方式用文本信息指导拓扑结构的重构;使用CLCD算法得到社区发现结果。本文对上述提出的算法在广泛的真实数据集和人工数据集进行实验验证,实验结果显示:与现有的社区发现算法相比,deep-CLCD算法能够更准确的发现社区;ECSD算法可以在标签量较少的情况下达到较好的效果;CGLCD算法在处理文本融合链接数据集时表现良好。
其他文献
在有限群研究中,群的阶和群的元素的共轭类个数是群的两个非常重要的数量,这两个数量对群的结构及性质有很大影响,很多有限群完全可由这两个数量确定.对于阶为n的有限群,n ∈ {2p,4p,8p,pq,2pq,p3,2p2,3p2}(p,q为奇素数),根据分类定理,一定有或多或少的互不同构的n阶群,对这些n阶群,利用它们的生成元与生成关系及数论和群论知识确定了它们的共轭类,并由此得出它们的共轭类的个数,
翘嘴鳜(Siniperca chuatsi),属于鲈形目(Perciformes)、鳜亚科(Sinipercinae)、鳜属(Siniperca),是我国的名贵经济鱼类和重要淡水养殖品种。近年来随着我国翘嘴鳜养殖规模的
近来,科技的飞速发展使地理空间专业人士能够远程收集特定目标上的多种类型的传感器数据。这些数据带来的挑战与机遇并存。一方面,数据的异质性给它们的高效处理带来了挑战,但另一方面,多源数据集的涌入和可用性也为组合利用异源和多模式数据提供了新的机会,从而使地理空间应用的结果得到改善。LiDAR数据可提供丰富的空间/几何信息,但由于缺乏光谱信息,其在(复杂)城市场景识别任务(如分类)的应用范围有限。高光谱影
随着汽车安全及轻量化的发展,高强度钢和铝合金在汽车生产中的应用越来越广泛,钢和铝的大量应用使得连接技术成为了解决材料应用的关键。由于钢和铝的热物理和化学属性差异较大,传统的铆接技术连接强度低、接头外观差;而熔焊技术容易在接头产生大量的脆硬金属间化合物,焊缝易产生裂纹。本文研究的搅拌摩擦焊接技术作为一种固相焊接技术,可以在低输入状态下对板材进行焊接,接头强度高,可以有效的控制焊接过程中金属化合物的产
系统性风险问题在2008年全球金融危机后进入各国学者和监管者的研究视野,由一家银行倒闭进而迅速蔓延至整个系统的危机让大家了解到系统性风险的负外部性与溢出性,系统性风险的危害极大且范围极广,因此对其展开研究有着十分重要的意义。随着利率市场化,经济全球化的逐步推进,银行系统性风险不断累加,由于商业银行在金融系统中发挥着不可替代的重要作用,研究银行系统性风险问题刻不容缓,能够为宏观审慎监管提供新的思路与
航空发动机部件性能退化会严重影响整机性能,导致发动机推力不足和飞机作战能力下降,国内外都将发动机状态评估和性能寻优控制技术作为重点研究内容。由于仿真模型与实际发动机的偏差以及模型和算法的复杂性,使得基于模型的发动机状态评估和性能寻优在实际应用时受到诸多限制,因此开展高精度实时模型建模方法研究和先进参数估计算法研究具有重要的意义。本文以某型双转子涡扇发动机为研究对象,研究了卡尔曼滤波器在发动机部件性
互联网技术的快速发展进一步推动了全球经济一体化的进程,提高了经济发展水平。对于企业来说,只有不断发挥自己的优势和优势,要解决当前企业面临的发展问题,我们可以在日益激烈的市场竞争中保持自己的优势。实现企业持续稳定的发展。企业人力资源核心发展方式是员工培训,越来越多的公司将培训视为改善商业利益增长的重要途径。互联网技术以及强大的知识经济趋势改变了人们的购物,生活和金融习惯。它依靠自身的便利性,速度和灵
目前已有的研究成果对于成品油管道内固体颗粒的关注点均为固体颗粒发生“运移”或“沉积”状态下对应的油流临界条件及其影响因素,并未关注固体颗粒“运移”与“沉积”的动
形式自对偶码作为一类重要的码,而得到许多学者们的广泛研究。它不仅具有良好的代数结构,而且相较于相同长度和相同码字个数的自对偶码而言,某些形式自对偶码具有更大的极小
背景胰腺导管腺癌(Pancreatic adenocarcinoma,PDAC)是胰腺癌最常见的一种病理类型。原癌基因KRAS突变是PDAC最常见的突变类型,其中KRAS G12D(44%)突变最为常见。然而,在对于PDAC的治疗方案中,无论是针对KRAS蛋白的靶向治疗,还是免疫检查点抑制剂、抗血管靶向药物(如贝伐珠单抗、索拉非尼、阿西替尼、舒尼替尼……)等,均未对此类患者显示出卓越的疗效。盐酸安