论文部分内容阅读
随着现代社会网络的发展,各种社交网站如雨后春笋般出现在互联网的大潮上,人们也更倾向于在不同社交网站记录自己的点滴生活。如何从这些数据中简要的将这些信息的潜在价值直观的展现出来,以提供更好的网络服务,成为现今社会网络服务的一个重要分支——信息可视化。信息可视化通过收集不同网站的多样数据信息,构造简明的社会网络图,并保存和展示出原始网络图信息的社区特征、语义关系特征、拓扑关系特征等。我们需要一种适用于社会网络的布局算法,传统的布局算法通常只从社会网络图的拓扑关系出发,从拓扑结构上进行分析,然而这种方式忽略了社会关系网络最基本的特性——社区特征。本文首先介绍了一些常用的可视化技术,然后根据课题需要,对node-link布局算法列举了两类常见布局算法——Force-directed单级布局算法和两种多级布局算法。通过分析现有布局方法的不足,提出一种新的基于社区的自适应多级布局算法,以更好的适用于具有明显社区特征的社会网络关系图。文章的主要研究内容如下:(1)提出了一种基于社区的社会网络划分的改进方法,该算法改进了多级布局中边强度的计算方式,使之更合理更适用于多级策略。改进后的算法相对于原算法,其对社区划分的准确性有了相应的提高,为后文基于社区的布局做好基础工作。(2)针对社会网络图的社区特征,提出一种新的自适应细化布局方案,从社区与关系广度两个角度出发,构造出新的目标函数来满足这两个角度的目标。该目标函数采用梯度下降的方法进行求解,并与上述的社区划分算法相结合,共同构成了本文提出的算法——基于社区的自适应布局算法。(3)以微博数据可视化分析的需求为例,提出了适用于重点分析的自适应树形鱼眼布局算法,该算法达到了合理利用布局区域、重点区域信息优先展示的要求,同时允许重点布局范围的切换功能。(4)通过现有的微博数据,开发了一个微博数据分析可视化系统,该系统主要包括微博服务器端的数据预处理、查询检索功能和提供给用户端的人物关系分析和事件传播功能,同时包含了一些用户分析中需要的其他辅助功能。