论文部分内容阅读
针对基于密度的孤立点检测算法LOF时间复杂度高的问题,通过优化数据对象邻域查询过程,提出一种两阶段的改进算法DBLOF,先采用DBSCAN聚类算法对数据集进行预处理,去除大部分的非孤立点,得到可能异常数据集,然后再利用LOF算法计算可能异常数据集中对象的局部异常因子并以此找出真正的孤立点。实验结果表明,改进算法能实现有效的局部孤立点检测,并能够降低算法时间复杂度。