论文部分内容阅读
谱聚类算法作为一种有效的聚类分析方法,理论基础可靠,聚类性能良好,已在文本分析、语音分析、机器视觉以及图像分割等领域成功应用。谱聚类算法具有诸多优点,但其缺乏自适应性,即需要手动设置相似矩阵的尺度参数、聚类数目,在实际应用中受到一定的限制。本文针对谱聚类算法存在的问题和不足进行了改进,并将改进的算法应用于图像分割领域。具体的研究内容如下:(1)针对传统的谱聚类算法计算相似矩阵时尺度参数需要手动设置的问题,给出了一种基于自然最近邻的谱聚类改进算法。采用局部尺度参数计算相似矩阵,首先引入自然最近邻居搜索算法,并对该搜索算法的终止条件进行了改进,减少了算法的时间复杂度,然后利用该搜索算法产生的密度信息计算每一个数据点对应的尺度参数,即计算每个点的局部尺度参数,并代入高斯核函数中进行相似矩阵的计算,最终完成聚类。在合成数据集和公共测试集上进行试验测试,结果表明,与原始谱聚类算法及几种典型算法相比,本算法将Fmeasure指标提高了 5%左右。(2)针对谱聚类算法的聚类数目需要人为设定的问题,给出了一种基于特征间隙的谱聚类改进算法。通过分析规范化拉普拉斯矩阵的特征值与聚类数目的关系,引入特征间隙的概念,计算特征值的本征间隙序列,找到该序列第一个极大值点,该点对应的下标记即为聚类数目。通过对合成数据集和公共测试集进行试验测试,表明本文算法能比较准确的确定聚类数目,聚类结果Fmeasure指标提高6%左右,且更具鲁棒性。(3)本文针对传统的K-means算法采用随机初始化的方法初始聚类中心,导致聚类结果很不稳定,易陷入局部最优的问题,给出了一种基于密度初始化的谱聚类改进算法。利用自然最近邻算法得出的密度信息,选取处在高密度区域的点作为备选初始聚类中心,利用最大最小距离选取最终的k个初始聚类中心,对K-means算法初始化,避免算法陷入局部最优,出现不稳定聚类结果的情况。本文在公开测试数据集上进行试验验证本算法的性能。(4)改进的自适应谱聚类算法在火焰图像分割中的应用。本文将基于自然最近邻和特征间隙的谱聚类算法用于图像分割。首先,在Berkeley大学的标准分割库上进行测试,结果表明,本文算法比原谱聚类算法的分割结果在RI指标上提高了 4%到7%;然后,将本文算法用于火焰图像分割,对网上共用的和自行拍摄的火焰图像进行试验测试,结果表明,本文算法具有较好的分割效果,可应用于视频火灾检测的火焰图像分割。