论文部分内容阅读
现代人类社会和虚拟网络社会的方方面面都存在网络型数据:通信网络、社交网络、学术合作网络、生物基因网络等。因此,如何有效的分析网络数据,揭示其数据背后所隐藏的信息,是亟须解决的问题。数据可视化可以将不可见的现象转换为可见的图形符号,帮助从中发现规律和获取知识。而随着近年来数据可视化不断的发展,愈来愈多的研究者和管理者选择数据可视化的方式协助其探索网络中的有效信息。随着网络深入到人们的学习和研究生活的各个方面,网络数据可视化分析与研究成为热点问题。网络数据可视化方法所面临的挑战主要来自于网络的规模,一方面,很难在有限的浏览器空间中将全部的数据节点、边、关系等同时展示;另一方面,过多的展示信息并不利于用户对网络进行有效的探索。因此,网络数据的可视化的其中一个难点在于网络的压缩与简化。在大规模网络可视化与分析中,抽样是一个关键步骤,尤其是大规模异质信息网络中存在多种类型节点和链接关系,这更加大了抽样的难度。本文设计一种适合异质信息网络的抽样算法,同时,针对信息网络数据可视化设计并实现了一个有效的工具帮助用户进行信息网络数据可视化分析,本文的主要研究内容如下:1.设计了一种基于特征向量中心度的异质网络抽样算法。由于现实中的网络是包含着多种节点类型或节点间的链接关系的异质网络,且通常规模较大,因此,抽样是网络可视化分析中非常重要步骤,而传统的抽样方法由于很少考虑到网络中不同的节点类型,所以很难直接应用于异质网络可视化分析中。因此,本文设计了一种异质网络抽样算法,该算法基于节点特征向量中心度的值进行抽样,考虑了不同类型节点在网络中重要程度不同这一因素。通过用户交互的方式,动态改变抽样网络结果,使得用户可以通过自己的知识深入挖掘和探索异质信息网络的有用信息。2.设计并实现了一个信息网络可视化工具。现有的网络数据可视化工具大多只是将已知的网络结构进行各种可视化展示,存在在可视化探索流程上并不完善,不易于用户解决异质信息网络场景下的可视化分析等问题。因此,设计一个可以应用于信息网络数据可视化分析的工具,帮助用户更好地探索、分析网络数据是非常必要的。本文设计并实现了一个信息网络数据可视化工具。该工具提供一个完整的用户可视探索数据的流程,结合了本文提出的异质网络抽样算法,通过用户交互完成对网络数据的探索,从而发现信息网络中的数据特征及其关键信息,并通过UCIKDD Archive电影合作关系网数据集,设计了实验及案例分析,具体说明了如何使用本文的可视化工具对异质信息网络数据进行可视化分析。