基于高阶差分和网格划分算法的DBSCAN参数自动选取算法

来源 :计算机应用研究 | 被引量 : 1次 | 上传用户:changjian200910
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对DBSCAN算法中的两个参数eps和min Pts通常依靠经验选取所带来的不足,提出一种高阶差分和网格划分相结合的快速DBSCAN自动参数选取算法。首先分析数据集中数据点与参数的关系,通过引入高阶差分算法自动获取eps和min Pts两个参数;然后利用网格划分对数据集建立网格索引,优化算法的运行效率,最后针对噪声点过多的数据集提出去极化操作,增强算法的鲁棒性。算法应用于flame等九个数据集,分别与传统DBSCAN和AGD-DBSCAN算法选取的参数进行聚类效果和算法运行效率的对比分析。结果表明
其他文献
<正>中国砂石骨料年用量超过200亿吨,是目前开采量最大的矿产资源。近期,由于市场砂石骨料"有价无货",导致很多基础设施工程建设"等米下锅",工程进度受到影响。砂石成了混凝
最长循环公共子序列(LCCS)是两个字符串在所有可能的循环移位操作下能得到的最长公共子序列(LCS)。针对穷举移位量求解LCCS效率过低的问题,设法对候选移位量进行筛选。通过证明循环移位操作对两字符串间LCS长度增量影响的上下限,得到最优移位量的必要条件,从而减小了求解LCCS的枚举量;在此基础上,建立了求解LCCS的迭代方法,只经过少数几次迭代便可消除绝大部分无效候选移位量;此外,还提出一个可在
目前学习子句删除策略广泛采用的是基于LBD的评估方式,LBD评估方式在每次执行删除时都会删除前一半LBD值大的学习子句,这种方式对LBD值大的学习子句的删除过于激进。针对此问题,提出了一种利用冲突回跳层数(back-jump levels)的评估方式来保留LBD值较大的有用学习子句。以CDCL(conflict driven clause learning)完备算法为框架,在子句删除环节形成了BJ