论文部分内容阅读
“大数据”已成为近年计算机信息技术行业关注的热点。如何利用现有技术挖掘出数据背后隐藏的丰富信息,进而创造更高的经济价值,是大数据发展的问题之一。可视化挖掘技术以图形图像的方式表现数据,使不具备数据挖掘专业知识的普通用户也能参与到信息挖掘的工作中,而且良好的交互操作也便于用户对数据的各种探索。目前种类繁多的可视化技术从实现原理、表现形式、适用对象等方面都存在不同。因此,科学地评测这些技术已成为可视化技术发展的关键。本论文通过分析树图可视化技术的基本思想、布局算法、交互设计、视觉表现、适用范围等特征,构建了一个针对树图可视化技术的度量模型,同时设计实现了基于WEB的树图可视化及其度量评价系统,初步完成了对树图可视化技术的综合评价。主要的研究工作有以下三点:1.分析了树图可视化的图像特征及优缺点,从数据对象规模、用户认知复杂度、视觉效果及表现三个方面,提取了影响树图可视化应用效果的八个度量指标,并采用层次分析法计算各度量指标的权重值,建立了树图可视化技术的度量模型。2.根据提出的度量模型,设计并实现了树图可视化及其评价系统,主要包括数据预处理模块、树图可视化模块和度量评价模块。该系统支持JSON和XML两种类型的数据文件,实现了Slice-and-dice、Squarified、Strip和Spiral四种树图布局算法及其度量测评。3.运用系统提供的四种树图算法对几组不同类型的实验数据集进行可视化,并分别对各组的可视化结果进行度量。通过对度量结果进行横纵对比,验证了该度量模型的合理性和有效性。实验结果表明,该度量模型可用于评价不同树图布局算法的优缺点,帮助用户对不同的数据集选择最优的树图表现形式。本文以树图为研究对象建立的度量模型,在一定程度上解决了树图的定量评价问题,该结果有助于今后树图的理论研究和实际应用。