社交网络中的社区检测算法研究

来源 :战略支援部队信息工程大学 | 被引量 : 2次 | 上传用户:wwvicky
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社区检测是社交网络分析中的一项非常重要的工作,通过社区检测可以挖掘网络中蕴含的组织结构信息、发现网络承载的社会功能等。论文基于社交网络中丰富的、不同视角的数据资源,以通过多视角数据融合来提高社区检测准确性为出发点,探索研究了多视角学习与不同类型社区检测方法的融合,主要研究工作如下:1.将社交网络中用户间的关注、提及、转发等多视角关系和先验连接信息融于到基于遗传算法的网络社区检测方法中,论文提出了一种融合先验信息的进化多视角网络社区检测方法。该方法以网络划分模块度为优化目标函数,综合考虑用户间的关注、提及、转发等不同视角的交互关系信息,将多视角信息融入到基于遗传算法的网络社区检测方法中,并且,在利用遗传算法进行网络社区划分优化时,将用户间的先验连接信息融入检测算法,利用先验信息指导进化搜索过程。文中的仿真实验结果表明,多视角信息的融合和先验信息融入能够提高网络社区检测的准确性。2.将选择性集成学习方法融入到基于遗传算法的网络社区检测中,提出了一种基于选择性集成的网络社区检测方法。针对基于进化优化的网络社区检测方法多次独立运行检测结果评价指标出现波动的问题,对多次网络社区检测结果的集成问题进行了研究,给出了两种选择性集成方法,一种是基于遗传优化的选择性集成方法,另一种是基于Pareto进化优化的选择性集成方法。所提检测方法首先基于多视角信息和遗传优化算法进行多次独立网络社区检测,得到多个网络社区检测结果;然后,利用进化优化算法对多个网络社区划分结果进行选择性集成,从而得到最终的检测结果。文中的仿真实验结果表明,选择性集成可以提高网络社区检测的准确性。3.针对网络社区检测中链接关系数据和内容数据的融合问题,提出了一种融合多链接关系和内容属性的网络社区检测方法。该方法首先对多个链接关系网络进行融合,剔除其中的错误信息;然后,利用链接关系网络的近邻结构实现图模型的构建;最后,利用对称NMF对近邻图和内容数据进行融合,通过引入不同视角归属矩阵之间的差异函数来松弛对归属矩阵的约束,进而设计有效的迭代方法,从而得到更准确的社区检测结果。在不同数据集上的检测实验表明,本文提出的算法能够有效融合两种不同性质的数据信息,获得更真实的社区检测结果,并且能够克服不同视角数据质量差异大的问题,保持结果稳定性。4.针对网络社区检测中部分用户节点数据信息缺失问题,对数据缺失情况下的多视角异构社区检测问题进行了研究,提出了部分节点数据缺失的融合社区检测方法。该方法构造了两种处理缺失数据的正则项,一种是在进行不同视角数据间融合时,对缺失数据的用户不参与融合;另一种是利用缺失数据用户的其它视角的最近邻数据信息作为替代信息,参与视角之间的融合。在此基础上,提出了基于两种正则项的异构多视角社区检测算法。在社交网络数据集上的检测实验结果表明,文中提出的检测算法能更好地解决多视角社区检测中存在的视角性能差别大、数据缺失等问题,获得真实、可靠的社区检测结果。
其他文献
在MATLAB/Simulink环境下,对电磁型(EMS)磁浮列车,利用Lagrange方程,结合动力学和电磁学基本理论,建立了单磁铁磁悬浮系统的数学模型,给出了采用线性二次最优控制策略的系统
近年来,管桁结构在桥梁工程中得到了越来越多的应用。对于管桁结构来说,作为杆件的连接处的节点,可以说是结构中的重要部位,但也是整个结构中最薄弱的环节,因此节点部位的需
《防治煤与瓦斯突出规定》第四十条提出“区域防突措施应当优先采用开采保护层”。保护层开采是我们目前主要采用的区域性防治煤与瓦斯突出措施。目前有关的研究,对远距离、
武夷岩茶是我国地理标志保护产品之一,属于半发酵乌龙茶。本研究通过高通量测序技术对29个武夷岩茶样品中的真菌种群进行了检测鉴定,并对原产地内外茶样中的真菌群落多样性进
贝莱斯芽孢杆菌(Bacillus velezensis)为淀粉液化芽孢杆菌和枯草芽孢杆菌亲缘相近的新种,三者均是生产surfactin的主要菌种。surfactin是构成抗菌脂肽的核心成分,具有极强的
结果补语可能式是可能补语范畴下的一类,指在述语和补语中间插进“得”或“不”字,构成一种表示动作结果是否能够实现的能性表达格式。该结构作为现代汉语中较为独特的能性表达格式,其句法结构虽易习得,但由于语义复杂、使用限制条件较多,且在多数留学生的母语中并不存在与之对应的语法现象,是对外汉语教学中的重点及难点之一。从动结式与结果补语可能式的关系上看,两者之间存在着转化关系。结果补语可能式与动结式都是述补结
随着世界贸易的全面发展和全球气候的快速变化,外来植物入侵风险显著增加。外来入侵植物在入侵区域的广泛扩散,使生态系统的稳定和生物多样性的维持都遇到了极大的挑战,对外
从房地产部门投资的快速增长角度,来理解房地产是否是阻碍中国创新活动的重要因素,这对中国经济可持续发展而言无疑是具有重要现实意义的研究命题。使用中国的省级层面面板数
汽车及零部件产业具有较强的区域经济带动效应,全球的许多国家及地区都试图将其建成支柱产业。但伴随全球经济一体化竞争的加剧,大量汽车产业的企业都是在全球价值链的低端求生
汉语动结式是致使结构中一种重要且很有特点的汉语句法结构,其语言学本体研究引起了国内外学界极大关注,其基本结构是“NP1+V1+V2(+NP2)”,其中V1和V2之间存在致使关系,作为动结式补语的NP2可以不出现。基于此,本文尝试从基于语料库和深层自然语言处理角度出发发现语言学规律,对汉语动结式的句法语义进行阐释,并运用中心语驱动语法(Head-Driven Phrase Structure Gra