论文部分内容阅读
聚类分析广泛应用于各学科,如模式识别、图像处理、机器学习以及统计学等。k-均值算法是最常用的一种聚类算法。而随着人工神经网络的快速发展,人工神经网络的应用也越来越广,神经网络中的自组织竞争神经网络常用于模式识别领域。本文主要针对k-均值算法与自组织竞争神经网络进行了研究,并研究了算法在人脸识别、入侵检测及缺陷检测中的应用。具体研究内容如下:(1)近年来提出了一种新的k-均值算法即全局k-均值算法,它是一种逐步增加聚类中心的算法,算法每一次进行全局搜索确定一个初始中心,聚类准则与k-均值算法相同即以聚类误差为准则。全局k-均值算法有时候得到的簇只有一个元素;有时候选取的初始点很差,而初始点选取不好会导致局部最优解的出现,即达不到理想的聚类效果。首先为了消除得到的簇只有一个元素的缺点,提出了改进的全局k-均值算法;其次,应用MinMax k-均值算法的思想对全局k-均值算法进行了改进,得到了更好的初始点。提出的算法在通用的数据集上进行了测试,测试结果与k-均值算法、全局k-均值算法以及MinMax k-均值算法进行对比,实验结果表明,提出的算法优于其它几种算法。(2)MinMax k-均值算法通过使最大类内误差最小化来解决初始点选取不佳带来的影响。该算法中存在两个参数,即指数参数和记忆参数。选取不同的参数将得到不同的聚类误差,因此参数的选取至关重要。原始算法中认为只要给定指数参数选择的最大值,算法将自适应的选取最佳参数从而使得最大类内误差最小。然而,实验表明,这种说法并不是完全正确的。因此,应用粒子群算法对原始算法进行了修正,修正后的算法在每次实验中都可以得到使得最大类内误差最小化的最优参数。提出的算法在不同的数据集中进行了测试,测试结果与k-均值算法及原始MinMax k-均值算法进行比较,结果显示,提出的算法的聚类误差最小。(3)为了克服自组织竞争神经网络中的科荷伦自组织映射网络(SOM)分类类别数比实际类别多的缺陷,提出基于系统聚类法改进的SOM神经网络算法和基于k-均值算法改进的SOM神经网络算法。将改进的算法应用到人脸朝向识别和入侵检测中,实验结果表明,与学习向量量化神经网络、模糊c-均值聚类算法、基于模糊聚类广义回归神经网络算法相比,提出的算法聚类效果更好。(4)稀疏子空间聚类是利用稀疏表示系数构造稀疏相似图从而对子空间聚类进行。根据稀疏表示技术,算法应用1l范数得到稀疏系数,再通过谱聚类的方法得到最终的聚类结果。而谱聚类算法是利用k-均值算法对数据进行聚类,k-均值算法对初始值的选取比较敏感,而且需要大量重复运行,为了克服这两个缺点,提出了两种改进稀疏子空间聚类的方法。算法改进后,得到的结果将不再受到初始中心选择和重复运行的影响。第一种改进算法利用比较相似图中邻接矩阵的零元素所在的位置得到聚类结果;第二种改进算法应用改进的SOM分类算法代替k-均值算法进行聚类。将基于改进的SOM分类算法的稀疏子空间聚类方法应用到人脸识别上,实验结果表明,提出的算法得到的结果优于原始的稀疏子空间聚类算法的识别结果。(5)金属表面缺陷的分类在激光超声缺陷检测中具有重要的作用。提出了利用自组织竞争网络,自组织竞争神经网络的扩展网络学习向量量化神经网络和概率神经网络等方法对激光超声探伤缺陷表面波进行分类。讨论了三种网络在不同输入情况下的分类效果。实验结果表明这三种神经网络都可以取得良好的分类效果。