论文部分内容阅读
蓬勃发展的社交网络正深刻改变着人们的生活,也带来了前所未有的机遇和挑战。社交信息传播具有高效性和广泛性的特点,有利于新商业模式的形成,从而创造巨大的商业价值。研究信息传播规律能够更加准确地扩散内容(例如商品推荐、新闻推送),进而促进社交经济的发展。复制转发和轮番营销产生的陈旧重复信息容易使用户失去兴趣。因此,根据个人偏好推荐内容更能够促进信息的高效传播。此外,探索社交传播路径有利于定位优势合作对象从而促进信息传播。故而,发掘潜在社交关系至关重要。由于社交信息传播的演化规律变的更加复杂,如何识别最大影响力传播者、滤除冗余促进信息传播、发掘潜在社交关系,从而把握影响信息传播的关键技术与信息整体传播的演化趋势,是目前社交传播研究一直探索解决的问题。因此,本文结合了复杂网络、推荐系统理论和链路预测理论的研究思想与方法,遵循分析社交现象到挖掘传播本质、分析宏观网络结构到探析微观社交节点的分析思路,探索了影响信息传播的因素,制定了相应的有效策略并建立了相应的算法模型。论文主要工作及创新点如下:1)从宏观结构层面研究促进社交传播的机理,探索增大传播范围、降低爆发阈值的影响。研究结果表明,相对于全局影响力传播者选择策略,局部影响力传播者选择策略可以有效降低算法复杂度并提高传播效率。通过研究局部最有影响力传播者识别策略,提出一种基于随机游走种子选择的传播阈值模型。通过对人工网络和四个现实网络的数值仿真,分析对比各种选择策略下的传播规模,发现当优先选择局部汇点(Hub节点)作为种子传播者时,可以降低爆发阈值并增大传播规模。分析结果为研究社交网络信息传播提供理论依据。2)从微观角度基于节点的社交偏好特征出发,研究增强信息多样性的传播机理。重点关注局部信息推荐对信息传播的影响,降低现有推荐算法中对象属性的冗余相关性,进一步提升推荐的准确性和多样性。针对信息推荐中的属性冗余相关性和重复性,本文提出消除冗余扩散和补偿平衡(简称ERD-CB)信息推荐算法。通过分析源于对象的属性相似冗余,推导出最小相似估计偏差值,进而删除二阶相似性冗余。同时,基于平衡质量扩散与热传导理论,实现推荐准确性和多样性的平衡补偿,在过滤冗余信息的同时,提高推荐的准确性、新颖性和多样性。实验结果表明,在准确性、新颖性和多样性性能方面,ERD-CB模型优于现有的5种主流基准算法。3)从微观角度基于节点的社交关系特征出发,研究挖掘潜在路径的传播机理,重点关注准局部传播路径的预测。分析结果表明,相对于低准确性的局部算法和高复杂度的全局算法,准局部算法在提高链路预测准确性的同时还可以降低实现复杂度。针对挖掘潜在传播路径的问题,链路预测技术可以有效实现传播路径的预测。经研究发现,节点通过邻居的影响力可以有效吸引未连接的端点。因此,节点邻居影响力的差异性会导致邻居向节点贡献影响力的差异。从而,本文设计了基于邻居贡献力(NC)的链路预测模型。12个真实网络上的仿真结果证实基于邻居贡献力的模型能够有效提升社交网络中链路预测的准确性。4)在基于邻居贡献力的研究基础上,针对传统链路预测算法仅考虑邻居影响力广度而忽略深度的问题,本文发现H指数可以有效表征邻居影响力的深度。通过分析邻居关系网的连通广度和深度,本文提出基于邻居度和邻居H指数影响力的链路预测模型(ION-D,ION-H)。通过实验仿真得出,与主流指标相比,预测模型具有更高的精度,并有效提升了社交信息传播路径预测的准确性。