论文部分内容阅读
一类支持向量机将数据样本映射到高维空间,通过与坐标原点保持最大间隔的特征超平面检测孤立点。实际应用中算法对坐标原点的选择依赖性较强,检测性能受数据样本的分布影响较大;将算法转化为求解二类问题在一定程度上克服了这些不足,但其带来的数据不平衡问题受到现实中孤立点样本稀少或者不存在的影响。该文提出了"孤立点一类支持向量机"算法,并在此基础上设计了一种无监督的孤立点检测方法。分别基于超平面距离和概率输出大小定义两种孤立点异常程度,设定不同权值合并两种异常程度输出,将获得的可疑孤立点特征信息引入算法;在特征空