论文部分内容阅读
全排列是组合学中最常见和最基本的主题之一,在科学,工程和商业领域出现了许多问题。而且也出现在数学、组合数学、计算机科学、运筹学、计算分子生物学、自然语言处理、甚至配色方案等许多基础和应用学科中。但是,全排列问题是一个NP问题,排列集合的数目伴随着项目的增加呈现指数级别的增长。这将会耗费用户大量的时间去手动测试衡量所有排列的方案,使得用户难以评估潜在的解决方案并识别有趣的见解。为了解决上述缺点,使用可视化分析技术来解决多变量全排列数据的分析问题应运而生,通过可视化技术,探索从排列中搜索最佳序列的过程,比较序列之间的差异和从排列中找出一些模式,以帮助用户做出决策。本文设计了一个可视化系统PermVizor,一个新颖且可拓展的可视化系统,旨在帮助用户探索序列方案的排列,分布和比较。对于排列的可视化,提出了八个必要且全面的需求分析。论文的主要工作和研究成果归纳如下:(1)数据预处理以及模型构建:本文根据多变量全排列数据的特点,提出了一种新的相似距离计算方法,使用MDS算法对本文研究的多变量数据,降维投影到二维平面。再根据二维平面内,散点的空间距离,根据DBSCAN算法聚类。(2)根据用户需求设计可视化组件:MDS视图功能,提供关于全排列中所有序列方案的概览图,基于提取的特征向量在二维视图中分布和聚类。让用户能够使用图元探索每个排列的整体分布;PCP视图设计目的在于协助用户查看所选排列的统计信息,并通过基于像素和基于块的PermView视图,检查项目的详细排列以及每个排列的多变量信息;PermView视图提供多种探索模式,协助分析序列方案之间的差异性。(3)系统搭建以及案例研究:本工作最终完成一个完整的Web系统PermVizor,满足用户的八大需求。通过对经典数据集的案例分析和定性研究,进一步评估了所提出的可视化技术的有用性。并且该研究表明PermVizor可以帮助用户探索排列并确认它们在预期排列中的发现和决策。