论文部分内容阅读
网络流数据通常是由监控设备采集的大量网络日志数据。作为网络事件的重要载体,网络流数据是分析人员对网络运行状况进行评判的重要依据。网络流数据的数据维度较多、数据量庞大、分析层次多样,利用传统的分析方法难以对其进行全面细致的探索,同时给分析人员带来繁重的认知负担。可视分析方法以可视化的手段对数据进行处理,结合用户交互使分析人员可以快速从海量数据中挖掘有价值的信息,以便做出有效决策。当前,网络流数据的可视分析需要解决以下问题:一方面,针对网络流数据的多层次性以及主机关联性等特征,提出有效的分析方法。现有方法聚焦于单一层次,难以实现多角度分析。另一方面,根据分析对象的特点以及网络流数据的多元时变性,设计合理的编码与视图,从而实现可视分析的高效性。本文针对以上两大问题,对网络流数据可视分析方法进行研究,研究成果主要为以下三个方面:1.针对网络流数据的多层次性和主机关联性特征,设计了多层次关联可视分析模型,实现了由整体到局部、由局部到个体以及由点到面的可视分析。多层次关联可视分析模型包括数据转换、可视分析和视图生成等功能,其中可视分析为该模型的核心功能。可视分析分为多层次分析和关联分析。多层次分析以网络流数据的多层次性特征为背景,设计了整体时序分析的宏观层次,局部时序分析的中观层次,以特定主体为研究对象的微观层次,实现整体到局部以及局部到个体的分析流程。关联分析利用网络流数据的主机关联性特点,构建主机间的关系网络,分析主机节点间的关联规律,获取关系密切的主机节点,实现由点到面的分析流程。2.根据上述多层次关联可视分析模型,结合网络流数据的多元时变性特点,对视觉编码、视图与布局等进行详细设计与实现。多层次关联可视分析模型提供了可视化设计需要的分析对象、分析流程以及目标输出等内容,同时,网络流数据的多元时变性特征需结合经典的多元时变数据可视化方法。基于以上两点,本文对网络流数据可视化的视觉编码、视图与布局等进行了改进与详细设计,高效地完成了分析任务,实现了对多层次关联可视分析模型以及多元时变数据的可视化表达。3.基于上述方法,实现了网络流数据可视分析系统,该系统结合丰富的人机交互功能实现了对网络流数据的可视分析。采用权威性的VAST挑战赛的数据集对本系统进行案例评估,通过多层次分析和关联分析完成了各项分析任务,实现了对相关案例的实验分析,证明了本系统的有效性以及实用性。