论文部分内容阅读
图数据广泛存在于现实生活中,如,金融交易网络,学术合作网络,社交网络等。对图数据的探索和分析有利于人们理解实体间的关系模式,分析实体的行为,识别具有异常行为的实体。随着大数据时代的来临,图数据的规模不断增长,导致对图数据的分析的难度也不断攀升。而图数据的可视化技术可以帮助用户交互地对数据进行探索,可视地对数据中蕴含的信息和现象进行发掘。因此,图数据的可视化和可视分析在近年来一直是可视化领域中的研究热点。处理和分析大尺度动态图数据的复杂性主要体现在:1)图数据中蕴含各类子结构,许多分析任务都与子结构相关,如模式识别、异常检测等;然而,与子结构相关的算法,如子图匹配,子图同构等算法,往往具有较高的复杂度,很难在短时间内完成。在需要低迟滞的应用场合,为子结构相关的可视分析带来了挑战。2)处理大尺度图数据不仅面临效率的问题,而且提高了高效可视分析的难度。3)动态图数据隐含复杂的关联,不仅包含多变量关联关系,还存在跨时空的关联演化。4)动态图数据中,往往存在一些节点,它们的关联关系的演变与其他节点不同,如金融网络中的异常交易。针对动态图数据的异常关联的分析,必须通过可视分析的模式融合人机智能才可以达到实用的程度。本文以复杂图数据为主要研究对象,针对上述挑战,研究了如下四个问题:·面向子结构的图数据可视表达与可视分析。在数据空间中,利用表达学习的方法,基于图数据的拓扑结构将节点表示为高维向量。利用节点对应的高维向量,本文提出了一个基于用户交互的对子结构的查询方法,支持用户通过交互对网络中的子结构进行可视查询,并进行进一步的可视分析。本文比较了不同的向量表达应用在本文提出的查询方法时得到的查询结果的质量。同时设计和实现了一个交互式可视分析系统,支持用户以指定示例的方式对图数据中的子结构进行探索和分析。我们利用用户实验验证了本文系统在基于子结构查询的图数据探索任务当中的有效性。·面向大尺度图数据的多层次可视表达与可视分析。在可视空间中,探索适合于大规模图数据分析的可视表达。本文从两个个不同的角度,包括单人、多人扩线网络的可视化和网络社团的可视化,探讨了针对大规模图数据的可视化方法,并设计了相应的可视化方案。同时本文设计了一个交互式可视化系统,支持用户交互式的对大规模图数据进行探索、分析。·面向动态多变董关联的图数据可视表达与可视分析。在一些图数据中,实体间的关系是不断变化的。这种变化常常是由一些隐含的因素所导致。本文首先利用社会学中强联系弱联系的相关概念,设计了一个可视分析系统,以支持从动态网络中关系强度的整体变化的角度来分析动态网络的变化。之后,本文基于一种特殊的数据结构,即时间-关系-片段树,对一组变量间的动态关系进行可视化,支持用户对图数据在节点域和时间域中进行分割,迭代地识别具有特殊变化模式的子模式。·面向异常行为的动态图数据可视表达与可视分析。图数据中存在一些具有异常行为的节点。这种异常行为需要观察节点变化的时序模式才能进行识别。在现实场景中,识别、分析这些异常节点的行为具有非常重要的意义。本文基于少数类别探测算法,设计了一个适用于动态网络的树切割算法,以支持用户在动态网络中同时对多个具有潜在异常行为的类进行比较、分析。