论文部分内容阅读
双标图是一种广泛应用的可视化分析方法,但是当所研究的数据包含较多变量时,如果直接用双标图进行分析会导致图中较多变量重叠,不能很清晰地观察变量间的相关关系,可视化程度较低,分析效果不精确,因此寻找一些能够有效解决一般的多变量数据的统计方法就非常必要.针对上述问题,本文提出了两种增强双标图的可视化的分析方法,第一种是基于聚类分析的双标图分析方法,首先通过对原始数据进行聚类分析,得到新的数据集,然后对得到的新数据集进行双标图分析.另一种方法是基于主成分和聚类分析提出一种新的双标图分析方法.此两种方法不仅保留了数据间的绝大多数信息,而且使得双标图的可视化程度增强.对两种新的双标图方法进行实证分析,并与原始数据构成的双标图进行比较研究,验证了该方法的有效性,最后将两种新的双标图方法推广应用到成分数据上.论文主要由五章组成.第一章是引言,主要介绍了本文的研究背景,问题的提出及其实际意义,简要说明本文的工作及创新之处,并给出了本文的主要结构.第二章是双标图的简介,对双标图的一般模型进行了描述,简单介绍了双标图的基础理论知识,并简单介绍了三种类型的双标图.第三章简绍了两种增强双标图可视化的方法.针对多变量数据集,如果直接用双标图进行分析会导致图中较多变量重叠,不能很清晰地观察变量间的相关关系,可视化程度较低,分析效果不精确,故本章提出了两种增强双标图的可视化的分析方法.第一种是基于聚类分析的双标图分析方法,首先对原始数据集进行分类,得到一些新的数据集,然后利用双标图对新的数据集进行分析,分析每类中原始变量与均值变量之间的关系.对新的双标图分析方法进行实例分析,并与原始数据构成的双标图进行比较研究,验证了该方法的有效性.第二种是基于聚类分析和主成分分析的双标图分析方法,首先基于主成分分析和聚类分析,对原始数据集进行分类,得到新的数据集,对新的数据集进行双标图方法进行了实例验证,验证了该方法的有效性.以上两种方法不仅保留了数据间的绝大多数信息,而且使得双标图的可视化程度增强.第四章介绍了成分数据双标图的构造步骤及其成分数据的基本理论,将第三章提出的两种方法应用到成分数据中进行实例验证.第五章是结论部分.本文对两种增强双标图可视化分析方法进行了总结,发现在多变量数据集条件下,直接利用传统的双标图分析方法存在一些弊端,即可视化可能会降低,而本文提出的这两种增强双标图可视化的分析方法很好的解决了双标图可视化低的问题.本文的目的是希望找到一种既不丢失数据,又能很好的分析多变量数据集的双标图分析方法,使得可视化增强.