论文部分内容阅读
有效地对高维数据特征进行筛选与应用是目前数据预处理的研究热点。本文在一维均值方差(MV)独立性检验的基础上,提出一种新的高维数据检验方法(RP-MV独立性检验)。通过相关筛选算法、挑选最优投影的方式,将高维数据投影到低维,以进行高维数据的相关检验。模拟多次试验结果,并与其他现有的高维数据相关检验方法(投影相关检验、距离相关检验等)进行指标理论基础、计算复杂度、模拟试验结果的比较与分析,并说明本文所提出的检验能够快速有效的进行高维数据的特征筛选。在此基础上,本文进行了数据特征筛选的实证分析,运用真实光纤安防监测系统实测的入侵信号特征数据,分时域特征、频域特征进行多维RP-MV检验特征筛选,采用支持向量机分类模型对特征筛选前后的样本进行了判别分析,以最终分类模型的预测准确度为度量,分析用此检验进行特征筛选的有效性。并对此检验的应用领域及具体应用方法进行了研究与展望,为不同领域的高维数据分析提供了一种新的快速特征筛选方法。