论文部分内容阅读
微博是继BBS,传统博客,人人网等社交网络发展起来的在线社会网络的新形式。本文借助数据获取工具,从新浪微博上获取42079个用户数据,从以下几方面分析了对新浪微博进行了分析:1.新浪微博的复杂网络属性。从新浪微博的出度,入度分布,平均最短路径和聚类系数等方面证明了新浪微博的复杂网络特性,为研究基于新浪微博网络的信息传播机制提供了一定的参考;2.分析了微博用户发表微博数量及发表微博频率的分布特征,发现微博用户的行为特征也服从幂律分布,;3.根据出度,入度的分布特性,计算出新浪微博用户的几个变量值之间的相关系数,建立微博客用户的活跃度回归模型;4.从微博用户的出度,入度,发表微博数,使用微博的时间这四个维度考虑,选取了这四个变量作为分类的衡量值,将认证用户和非认证用户分别分为16个类型,并使用k-means算法识别这几个类型的用户中心,分析每类用户的特征;5.将获取的用户的地理信息数据通过Google Maps API发布在Google Maps上,从信息技术教育普及程度和经济发展水平两个角度解释了新浪微博用户的地域分布特征。
作为一个新的信息传播平台,微博具有实时性强,短文本这些传统在线社会网络不具备的特征,这些特征使微博在信息传播,网络舆情控制,网络营销等方面具有很高的研究价值和应用价值。本文从新浪微博的网络结构,用户特性等方面展开对微博的研究,为深入研究基于微博的各类应用提供一定的理论依据和参考。