论文部分内容阅读
面对传统的数据挖掘研究,以可视化的形式对数据挖掘的研究有其独特的优势。利用可视化技术可以使用户更好地了解数据挖掘的全部过程,包括从数据预处理的可视化展示,到数据挖掘过程的可视化显示,再到数据挖掘结果的可视化显示。用户与数据挖掘系统建立非常良好的交互沟通方式,如通过丰富用户的专业知识来规整、约束数据挖掘的过程,然后根据数据挖掘的结果再分析改善其过程,最终得到正确合理的数据挖掘结果,通过这些活动可以使用户对挖掘结果有深刻并且直观的理解,这样做打破了传统的数据挖掘算法的黑盒子模式。实践证明,将可视化技术应用到数据挖掘中有很高的研究价值。
本文的主要工作如下:
第一,对相关技术进行研究。包括可视化数据挖掘技术的研究,即通过观察数据挖掘可视化的结果分析调整其中的预处理技术,数据挖掘算法,使得可视化展现的结果更清晰正确。由于时间的关系本文实现平行坐标系技术,星型坐标系技术,多边形技术,散点图技术的展示。还分析数据挖掘算法中分类算法和聚类算法等等。
第二,对可视化数据挖掘系统进行总体设计。包括设计思路,系统设计原则,预处理模块,数据挖掘模块,可视化技术模块等各个模块的总体设计介绍。
第三,对可视化数据挖掘系统进行深入的分析和设计。包括系统设计的开发环境,接口设计,类图,用例图,各个模块的详细设计。预处理模块的设计包括非空化,去重复值,标准化,维控制;算法选择模块的设计包括数据挖掘算法中分类算法和聚类算法的设计;可视化技术模块的设计包括四个可视化方法的实现。
第四,将分类算法和聚类算法的结果用四种可视化方法进行展示,通过对展示结果的分析,确定了数据挖掘算法和可视化方法的使用特点和应用范围。
最后,对系统和项目进行总结,指出下一步的工作。