论文部分内容阅读
微博、论坛等交互式网站上的热点话题是网络舆情的源头与集散地,目前对热点话题的研究主要包括热点话题的检测与跟踪,针对特定网站上的话题进行模型的构建,但这些都无法反映热点话题的内在发展机制。本文创新性地引入人类行为动力学,根据人类行为在不同类型的社会活动中都表现出的一致内在规律性,分析虚拟用户的行为,研究热点话题的内在规律,对热点话题进行建模与分析。本文以网络热点话题为研究对象,以热点话题从起始到相对长一段时间内的“热度”作为一个时间序列,对该时间序列进行建模,深入刻画热点话题形成与发展的内在机制,达到分析热点话题规律的目的。本文主要进行了以下几个方面的工作:(1)针对特定话题的统计建模分析现有的主流研究,如研究网站浏览、在线电影/音乐点播、电子邮件的通信时间等,都集中在研究其时间间隔的分布上。本文突破常规,采用新的物理量,研究定长时间区间内事件发生的次数分布,对热点话题进行建模。由于常见时间序列模型不能够反映热点话题传播的内在机制,因此本文从统计建模的角度,针对特定的两个话题进行了建模分析,得出了可以很好拟合这两个话题的模型,并进一步构建能够适应不同话题的模型。(2)噪声的量化话题在传播过程中易受到外界干扰,尤其是人为因素的影响,使得话题在传播过程中产生大量的波动,这种波动性大多表现为脉冲形式。本文对脉冲噪声进行了深入分析,并对其进行了量化,从而在构建模型时有效仿真了脉冲噪声干扰。(3)脉冲模型的构建本文从实际情况出发(针对同一话题,网络用户可以多次发布消息),假设多次发布消息的用户数服从幂律分布,从用户行为的角度分析话题的特征,在模型中引入脉冲干扰,使模型更具随机性,更符合客观实际,从而可以拟合不同类型的热点话题。