论文部分内容阅读
随着21世纪进入大数据信息化时代,数据爆炸是当前信息科学领域面临的重大挑战。大数据时代,所需处理的数据复杂性越来越高,层次高维数据是现代生产生活中随处可见的混合特征数据集,而信息可视化是帮助可视挖掘的有效方法。目前,大部分的可视化方法只适用于具有单个数据特征的数据,针对层次高维这类同时具备多种数据特性的数据的可视化研究却很少。如何可视化层次高维数据并从中快速准确地挖掘出有用信息,为决策者提供辅助决策,是一项值得研究的课题。本文的主要工作和成果如下:1.针对层次高维数据可视化,首先,提出了一种基于圆形嵌套图和平行坐标的VPM(Venn Parallel Coordinates Mixing)混合可视化布局方法,采用基于D3布局算法的圆形嵌套图表示层次结构,依据平行坐标的思想,划分叶子节点的圆周为不同的属性轴。通过数据预处理、布局设计、属性映射、属性点连接及缩放、高亮等用户交互来实现层次结构中高维属性的可视化。然后,依据教师业绩的可视分析任务,建立教师评价模型,相应设计词云视图、排序视图、业绩构成比例视图、时序视图、聚类视图等可视化组件对数据进行多角度的可视分析与展示。最后,通过实验验证,让用户从交互式探索中分析教师发展模式。2.为了解决二维可视化容易溢出屏幕的问题,提出了一种基于树形结构和自适应层次的三维可视化布局,结合LOD技术和人物漫游、相机跟随等交互方式,建立模型与数据的对应,采用天然的树形结构表示层次信息,通过三维可视交互呈现高维属性信息。首先,在Maya中进行树叶和枝干的建模,在Unity3D进行三维场景搭建,并采用LOD技术从不同视点位置对场景进行不同层次模型的绘制,以加快场景绘制速度,提高可视化效率。在不同的LOD层次,通过标签的交互形式显示教师业绩数据中的高维属性信息,且支持用户以三维漫游的形式从不同角度观察数据,使用改进后的K-means聚类算法进行学院分类。最后,通过已有数据集对学院之后一年的业绩进行了预测,并与实际数据进行对比,证明预测的准确率。3.设计实现了一个基于B/S模式的二维可视分析系统和一个三维可视化场景。二维可视化系统前端页面展示上述的各个可视化组件,以用于用户与系统的交互。三维系统以Unity3D为开发平台,并使用LOD算法加快场景实时生成。本文提出了两种展示层次高维数据的可视化布局方式,二维可视化布局解决了之前属性维度不能超过四维的问题。三维可视布局相比二维,能够可视化的数据量更大,且支持用户感知漫游。本文采用教师业绩数据进行实验展示,能帮助系统用户——院校管理者对教师进行更好的管理及业绩考核。