论文部分内容阅读
离群数据发现与分析是数据挖掘的重要组成部分,现有离群数据挖掘算法主要针对如何检测离群对象,缺乏对挖掘出的离群数据集进行解释与分析的有效方法.通过对离群数据来源及特性进行分析,定义了离群贡献度的概念,提出了一种基于特征赋权的离群数据再聚类算法.实验表明,该算法可以有效地揭示离群数据产生来源,有助于对整体数据集的更全面了解.