论文部分内容阅读
在数据空间中不可避免地存在着一些严重偏离整体样本集合的其它观测值,这些离群数据对数据挖掘与分析结果具有重要影响.通过对各种基于统计算法的总结与比较,按一元到多元的探索性离群分析思路,设计了一般分布下的Grubbs离群检测法和基于似然的混合模型离群点检测方法,并对多维数据的统计检测技术进行了讨论.结果表明,在离群检测与分析中恰当地利用统计方法在低维数据中的有效性进行探索性数据分析是可行的.