论文部分内容阅读
社区检测是社交网络分析中的一项非常重要的工作,通过社区检测可以挖掘网络中蕴含的组织结构信息、发现网络承载的社会功能等。论文基于社交网络中丰富的、不同视角的数据资源,以通过多视角数据融合来提高社区检测准确性为出发点,探索研究了多视角学习与不同类型社区检测方法的融合,主要研究工作如下:1.将社交网络中用户间的关注、提及、转发等多视角关系和先验连接信息融于到基于遗传算法的网络社区检测方法中,论文提出了一种融合先验信息的进化多视角网络社区检测方法。该方法以网络划分模块度为优化目标函数,综合考虑用户间的关注、提及、转发等不同视角的交互关系信息,将多视角信息融入到基于遗传算法的网络社区检测方法中,并且,在利用遗传算法进行网络社区划分优化时,将用户间的先验连接信息融入检测算法,利用先验信息指导进化搜索过程。文中的仿真实验结果表明,多视角信息的融合和先验信息融入能够提高网络社区检测的准确性。2.将选择性集成学习方法融入到基于遗传算法的网络社区检测中,提出了一种基于选择性集成的网络社区检测方法。针对基于进化优化的网络社区检测方法多次独立运行检测结果评价指标出现波动的问题,对多次网络社区检测结果的集成问题进行了研究,给出了两种选择性集成方法,一种是基于遗传优化的选择性集成方法,另一种是基于Pareto进化优化的选择性集成方法。所提检测方法首先基于多视角信息和遗传优化算法进行多次独立网络社区检测,得到多个网络社区检测结果;然后,利用进化优化算法对多个网络社区划分结果进行选择性集成,从而得到最终的检测结果。文中的仿真实验结果表明,选择性集成可以提高网络社区检测的准确性。3.针对网络社区检测中链接关系数据和内容数据的融合问题,提出了一种融合多链接关系和内容属性的网络社区检测方法。该方法首先对多个链接关系网络进行融合,剔除其中的错误信息;然后,利用链接关系网络的近邻结构实现图模型的构建;最后,利用对称NMF对近邻图和内容数据进行融合,通过引入不同视角归属矩阵之间的差异函数来松弛对归属矩阵的约束,进而设计有效的迭代方法,从而得到更准确的社区检测结果。在不同数据集上的检测实验表明,本文提出的算法能够有效融合两种不同性质的数据信息,获得更真实的社区检测结果,并且能够克服不同视角数据质量差异大的问题,保持结果稳定性。4.针对网络社区检测中部分用户节点数据信息缺失问题,对数据缺失情况下的多视角异构社区检测问题进行了研究,提出了部分节点数据缺失的融合社区检测方法。该方法构造了两种处理缺失数据的正则项,一种是在进行不同视角数据间融合时,对缺失数据的用户不参与融合;另一种是利用缺失数据用户的其它视角的最近邻数据信息作为替代信息,参与视角之间的融合。在此基础上,提出了基于两种正则项的异构多视角社区检测算法。在社交网络数据集上的检测实验结果表明,文中提出的检测算法能更好地解决多视角社区检测中存在的视角性能差别大、数据缺失等问题,获得真实、可靠的社区检测结果。