论文部分内容阅读
层次可视化技术方法主要针有层次结构的数据信息,能够良好高效地反映出层次结构数据信息的结构信息和内容信息。文本聚类后的结果是具有层次结构的,而增量式文本聚类需时刻动态的对文本数据进行聚类操作,而聚类结果往往是动态变化的。本文针对层次结构数据的下行展示需求及视图的高效可读性需求,提出了一种面向增量式文本聚类的Venn图可视化方法。结合增量式文本聚类结果的层次结构特征,针对传统基于Venn图的层次信息可视化方法的不足,依据文本的热度属性对节点圆进行排序,形成节点圆序列,针对原方法中的无向性,引入了方向角的概念,改进了传统方法中节点圆排列方法,并以此对增量式文本聚类结果进行初始可视化,提高了视图的可读性;而后针对增量式文本聚类的增量特性,提出了增量式的节点圆排列方法,对新增节点圆进行布局,使增量前后的可视化视图发生较小的变化。算法验证证明了方法的有效性,满足层次下行的需求,提高了视图的可读性,并展现增量式文本聚类的增量特性。本文针对层次结构数据的上行展示需求,提出了一种面向增量式文本聚类的力导引可视化方法。结合增量式文本聚类过程和结果的特征,针对传统力导引方法在层次结构信息应用中的不足,依据父节点所处层次以及下层父节点自身的属性差异,动态改变节点与节点之间的作用力系数,并人为的改变当前节点的父节点对当前节点的叶节点之间的作用力系数;而后针对增量式文本聚类的增量特性,提出增量式的节点布局方法,对新增节点进行有效布局。算法验证证明了方法的有效性,能够突出子树间的差异,满足层次上行的需求,体现了增量式的聚类过程。