论文部分内容阅读
在大型的数据集中,通常包含一些数据对象,它们与数据的一般行为或既定模型表现不相一致,这些数据对象被称为异常数据.大部分数据挖掘方法将异常数据视为噪声或异常而丢弃;然而在一些数据探索中,如保险欺诈、信用卡欺诈、违规交易等检验中,罕见的事件可能比正常出现的事件更有意义.因此,在利用原始数据进行挖掘之前,有必要对其进行异常数据的查找和检验.