论文部分内容阅读
在线社交网络是人们沟通互动和传播信息的重要渠道和载体,其对人们生活既有巨大的积极影响,也带来了很多负面影响。因此,需要对在线社交网络进行研究分析,增强其积极影响,消除其负面影响。由多个具有某些共同特质的个体组成的在线社交网络群体是在线社交网络重要的中观结构。和基于网络连接稠密程度定义的社区相比,网络群体的定义更加强调聚集个体的共同特征因素。研究在线社交网络群体是在线社交网络分析的基础工作之一。本课题面向国家互联网舆情分析引导、在线群体社会交往等国家安全与社会发展的需求,对社交网络群体发现及其传播控制技术展开深入、系统地研究。群体发现是指基于群体的某些特征发现群体集的过程。目前,群体的结构特征已有大量研究,但反应群体聚集因素的属性特征还缺乏深入研究。同时在发现群体时,如何灵活考虑群体的多种特征,如何充分利用网络结构和属性信息,如何发现满足特定应用需求的目标群体集都是亟待进一步解决的问题。群体和信息传播息息相关,如何基于对立信源群体选择控制负面信息的传播也是目前研究的热点和难点。针对上述问题,本文从社交网络群体结构属性特征分析及其定义出发,采用多种优化技术研究综合多种群体特征的重叠和多层次群体发现方法,整合结构和属性的群体发现方法和基于样本信息的目标群体发现方法,并进一步基于群体研究快速有效的网络舆情传播控制技术。本文的研究成果有助于可视化社交网络组织结构、控制恶意行为群体传播影响、为产品推荐和市场营销等应用提供支撑等。本文主要创新性成果如下:(1)针对仅提供网络结构信息而未提供个体属性信息时的重叠群体发现问题和多层次群体发现问题,本文分别提出基于最大派系的重叠群体发现方法和基于多目标优化的多层次群体发现方法。重叠群体发现方法利用最大派系来帮助确定个体的群体成员身份,实验表明本方法能更准确地发现重叠个体及高度重叠的群体。多层次群体发现方法采用整合局部搜索的多目标进化算法同时优化两个描述群体不同性质的目标函数,该方法比现有多目标优化群体发现方法的准确度高。(2)针对网络结构与个体属性信息都被提供时的属性均质群体发现问题,本文提出基于多目标优化整合结构内聚与属性均质特征的群体发现方法。本文定义一个均质度函数衡量群体属性均质程度,并证明当不同群体属性值不同,同一群体内属性值相同时,均质度函数取得最大。采用多目标优化进化算法同时优化模块度和均质度函数来发现群体结构。实验表明本方法发现的群体结构内聚且属性均质,且不同群体结构对应于结构和属性特征相对重要性的不同平衡。(3)针对某些应用需要基于样本信息发现具有特定特征的群体集的问题,本文提出基于样本信息的目标群体发现方法。当样本信息为两个样本节点时,本文设计一个样本信息扩展方法将两个样本节点扩展为一组标本节点,基于标本节点推断目标子空间并挖掘目标群体集。当样本信息为样本属性时,本文定义一个统一的质量函数同时衡量目标子空间和群体质量,迭代优化子空间及其群体来发现目标群体集。相对无监督群体发现方法,本文的方法能充分利用样本信息快速发现符合应用要求的目标群体集。(4)针对如何快速有效控制负面信源群体的传播影响问题,本文提出基于局部影响力计算的群体传播控制方法。本文在两个典型的竞争传播模型上研究影响阻断最大化问题。方法思路为在节点的局部最大影响树上近似计算任意节点的阻断负面影响,迭代选择阻断负面影响最大的节点作为正面信源,并更新相关节点的阻断负面影响。本文的方法比贪心算法快几个数量级且影响阻断性能和贪心算法相近。