论文部分内容阅读
近年来,随着网络技术的迅猛发展和移动终端的快速普及,在线社交网络成为信息共享与快速传播的重要途径。特别是以微博为代表的在线社交网络平台拥有动辄上亿的庞大用户群体,形成了无比巨大的信息传播网络。这不仅有力地推动人类社会进入崭新的自媒体时代,而且不断驱动着社会和商业形态创新。本文旨在通过动力学建模以及数据挖掘方法和技术,从宏观趋势和微观行为两个层面揭示在线社交网络信息传播机制和规律。论文以挖掘网络拓扑对信息传播的影响为切入点,构建基于超级传播机制、兴趣衰减和社会强化复合机制、多信息合作竞争复合机制的在线社交网络信息传播动力学模型,进而从单一机制、复合机制以及多信息交互影响的复合机制刻画在线社交网络信息传播机制和演化趋势。同时,构建兴趣加权的随机森林模型,提高用户信息转发行为预测效果并指出不同用户属性对转发行为的重要性。本文的研究能够加速突破传统动力学模型对在线用户特征的刻画难题,实现用户行为模式与动力学模型的有效融合。研究成果揭示了信息传播与疾病传播的本质区别,明确了不同用户属性对信息传播的内在影响。相关结论不仅深化了在线社交网络信息传播的宏观机制和微观行为预测研究,而且可以优化各级政府部门舆论引导策略,并为相关企业商务模式创新提供决策依据。论文的主要研究内容如下。首先,以国内外4个典型社交平台为对象分析在线社交网络拓扑结构及其与信息传播的关系。基于在线社交网络与复杂网络基本理论,从网络节点度分布、同配性、小世界和无标度特征等分析Twitter、LiveJournal、新浪和腾讯微博等国内外典型在线社交网络数据,从节点度数着手研究网络拓扑结构与发布、转发等用户信息传播行为的相关关系。其次,从单一机制影响角度分析超级传播机制对在线社交网络信息传播趋势的影响。系统阐述超级传播机制并进行明确定义,进而结合新浪微博真实传播案例分析在线社交网络中的超级传播现象;引入超级传播机制改进SIR模型并建立动力学方程组,通过线性化分析系统的全局稳定点。最后,采用数值仿真方法分析超级传播机制影响下不同网络节点密度的变化趋势。再次,从复合机制影响角度研究兴趣衰减和社会强化作用下的在线社交网络信息传播规律。在评述国内外最新研究进展的基础上,明确定义信息传播的兴趣衰减和社会强化机制,并通过非线性函数进行定量化表示。在此基础上,从节点状态转移入手建立动力学方程组并分析网络传播阈值。采用数值仿真方法,分析兴趣衰减和社会强化机制以及恢复概率影响下的在线社交网络信息传播规律。又次,从多信息复合机制角度研究具有复杂交互机制的在线社交网络信息传播问题。引入种群动力学分析框架,提出以传播速度为基础的网络信息传播模型,并抓取新浪微博消息传播实际数据进行拟合验证。在此基础上构建Lotka-Volterra合作竞争传播模型,分析网络多信息传播过程中存在的合作竞争机制及其系统稳定性。最后,结合所抓取的新浪微博实际数据对模型进行仿真模拟。最后,采用机器学习方法从用户微观行为研究信息传播问题。以腾讯微博消息转发预测为切入点,分析用户特征属性、行为属性、活跃度和兴趣属性对转发行为的区分能力并建立预测指标体系;引入特征加权思想,构建兴趣特征加权的随机森林模型。通过实证分析模型性能,对比用户特征属性、行为属性和兴趣属性对转发行为的影响,揭示不同的用户属性在推动在线社交网络信息传播过程中的重要性。