论文部分内容阅读
现今网络言论的活跃性已经达到了前所未有的程度,BBS由于其自由和开放性,逐渐成为信息传播一个重要的集散地和网民民意表达不可忽视的平台。这些给BBS的谣言散播和舆论引导提出了新的问题与挑战,为此,对BBS网络的拓扑结构、特征分析、群体间的相互关系及信息传播,以系统的观点进行研究很有必要。本文就是在这些方面进行了探讨和分析,具体做了以下几个方面的工作。第一个工作是对BBS信息网络进行实证分析和研究。实证分析的BBS原始数据来源于国内某著名网站,由从2003年9月到2005年6月共计400多万条的BBS社区发帖和回复贴记录组成。从数据源,利用数据库技术和数据挖掘技术挖掘有关信息,组建BBS实证网络,这个组建的BBS实证网络是一个以发帖或回帖人为结点、回复的帖子为边的有向加权的网络。网络的特征分析表明:这个网络具有无标度和小世界特性,即该实证网络的度分布、点权分布和边权分布都呈现良好的幂律特性,并且具有高的簇系数和短的平均最短路径。另外,通过综合运用分类、关联、演化模型等数据挖掘方法,还对网络成员进行了分类,并对BBS网络群体间的竞争关系和BBS信息传播和反馈展开了讨论。分析发现:吸引回复贴多竞争能力强的群体,同时也是积极回复他人易被吸引的群体;这些群体是BBS网络论坛中的最活跃的成员,对信息的传播和舆论引导起到关键的作用。第二个工作是BBS信息网络理论分析。为了理论研究的深入,根据BBS实证网络表现出的各种特性,组建了两个BBS理论模型,即BBS无权理论模型和BBS加权理论模型。BBS无权理论模型中,新增成员所应该具备的连接动态性与成员间的竞争关系与BBS实证网络比较相符,但这个理论模型不能反映BBS实证网络权重关系。在BBS加权理论模型中,引入了动态加权机制,解析和仿真分析表明该模型的度分布、点权分布和边权分布与BBS实证网络一样都呈现良好的幂律特性,且幂律指数也比较的相符;另外还发现这个权重参数对理论网络的性能有很大改善作用,通过设置参数可以得到和BBS实证网络较为一致的簇系数和平均最短路径。借助于这两个理论模型,可以更加深入对实际的BBS网络展开研究。第三个工作是BBS加权理论的进一步探讨。因为BBS实证网络是一个加权有向的网络,原来的无权网络簇系数在描述BBS加权网络的聚类特性方面,显示了它的局限性。依据这种现实需要,提出了一种BBS加权网络簇系数,并给出数学表达式。该簇系数对加权网络的各边权重进行了较细致和全面地考虑,理论分析与仿真表明:该簇系数在描述BBS这样的加权网络的聚类特性方面有一定的优势。