论文部分内容阅读
针对DBSCAN算法中的两个参数eps和min Pts通常依靠经验选取所带来的不足,提出一种高阶差分和网格划分相结合的快速DBSCAN自动参数选取算法。首先分析数据集中数据点与参数的关系,通过引入高阶差分算法自动获取eps和min Pts两个参数;然后利用网格划分对数据集建立网格索引,优化算法的运行效率,最后针对噪声点过多的数据集提出去极化操作,增强算法的鲁棒性。算法应用于flame等九个数据集,分别与传统DBSCAN和AGD-DBSCAN算法选取的参数进行聚类效果和算法运行效率的对比分析。结果表明