K-均值算法与自组织神经网络算法的改进研究及应用

来源 :中北大学 | 被引量 : 37次 | 上传用户:luozd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析广泛应用于各学科,如模式识别、图像处理、机器学习以及统计学等。k-均值算法是最常用的一种聚类算法。而随着人工神经网络的快速发展,人工神经网络的应用也越来越广,神经网络中的自组织竞争神经网络常用于模式识别领域。本文主要针对k-均值算法与自组织竞争神经网络进行了研究,并研究了算法在人脸识别、入侵检测及缺陷检测中的应用。具体研究内容如下:(1)近年来提出了一种新的k-均值算法即全局k-均值算法,它是一种逐步增加聚类中心的算法,算法每一次进行全局搜索确定一个初始中心,聚类准则与k-均值算法相同即以聚类误差为准则。全局k-均值算法有时候得到的簇只有一个元素;有时候选取的初始点很差,而初始点选取不好会导致局部最优解的出现,即达不到理想的聚类效果。首先为了消除得到的簇只有一个元素的缺点,提出了改进的全局k-均值算法;其次,应用MinMax k-均值算法的思想对全局k-均值算法进行了改进,得到了更好的初始点。提出的算法在通用的数据集上进行了测试,测试结果与k-均值算法、全局k-均值算法以及MinMax k-均值算法进行对比,实验结果表明,提出的算法优于其它几种算法。(2)MinMax k-均值算法通过使最大类内误差最小化来解决初始点选取不佳带来的影响。该算法中存在两个参数,即指数参数和记忆参数。选取不同的参数将得到不同的聚类误差,因此参数的选取至关重要。原始算法中认为只要给定指数参数选择的最大值,算法将自适应的选取最佳参数从而使得最大类内误差最小。然而,实验表明,这种说法并不是完全正确的。因此,应用粒子群算法对原始算法进行了修正,修正后的算法在每次实验中都可以得到使得最大类内误差最小化的最优参数。提出的算法在不同的数据集中进行了测试,测试结果与k-均值算法及原始MinMax k-均值算法进行比较,结果显示,提出的算法的聚类误差最小。(3)为了克服自组织竞争神经网络中的科荷伦自组织映射网络(SOM)分类类别数比实际类别多的缺陷,提出基于系统聚类法改进的SOM神经网络算法和基于k-均值算法改进的SOM神经网络算法。将改进的算法应用到人脸朝向识别和入侵检测中,实验结果表明,与学习向量量化神经网络、模糊c-均值聚类算法、基于模糊聚类广义回归神经网络算法相比,提出的算法聚类效果更好。(4)稀疏子空间聚类是利用稀疏表示系数构造稀疏相似图从而对子空间聚类进行。根据稀疏表示技术,算法应用1l范数得到稀疏系数,再通过谱聚类的方法得到最终的聚类结果。而谱聚类算法是利用k-均值算法对数据进行聚类,k-均值算法对初始值的选取比较敏感,而且需要大量重复运行,为了克服这两个缺点,提出了两种改进稀疏子空间聚类的方法。算法改进后,得到的结果将不再受到初始中心选择和重复运行的影响。第一种改进算法利用比较相似图中邻接矩阵的零元素所在的位置得到聚类结果;第二种改进算法应用改进的SOM分类算法代替k-均值算法进行聚类。将基于改进的SOM分类算法的稀疏子空间聚类方法应用到人脸识别上,实验结果表明,提出的算法得到的结果优于原始的稀疏子空间聚类算法的识别结果。(5)金属表面缺陷的分类在激光超声缺陷检测中具有重要的作用。提出了利用自组织竞争网络,自组织竞争神经网络的扩展网络学习向量量化神经网络和概率神经网络等方法对激光超声探伤缺陷表面波进行分类。讨论了三种网络在不同输入情况下的分类效果。实验结果表明这三种神经网络都可以取得良好的分类效果。
其他文献
产业政策是引导国家产业发展方向、推动产业结构升级、保障产业结构协调发展、使国民经济健康可持续发展,由国家制定的政策。我国产业中主要的经济作物之一茶叶有着悠久的历
在一个28天的生长试验中,选择282头断奶后3天、初始体重16.1磅(7.3千克)的保育仔猪(PIC TR4×1050)来评估用合成氨基酸代替鱼粉对其生长性能的影响。将仔猪分为6个处理,每个处理
通过纵向和横向的梳理,总结我国电视财经栏目的发展历程和不同类型的电视财经栏目播音主持特点,以期为电视财经栏目的播音主持发展提供借鉴。
<正>大肠癌是最常见的恶性肿瘤之一,发病率在世界范围内处于恶性肿瘤的第3位,西方发达国家处于第2位。随着社会经济的发展和人民生活水平的提高,该发病率呈逐年上升的趋势。
许多猪病的发生都有非常明显的季节性,如在冬季由于外界环境对各种病原体的杀灭作用较弱,所以更易造成一些外源性传染病的发生和流行;但在夏季由于热应激造成机体抵抗力的下
简要介绍了工程担保的4种基本形式,具体阐述了秦皇岛市建设工程担保制度的实施情况,针对其运转过程中出现的主要问题进行了分析探讨,提出了相应的改进措施,以期进一步推动该
<正>失语症(Aphasia)是由于语言相关脑功能区及功能区间连接受损而出现的语言理解障碍、口语表达障碍等症状的病症[1]。失语症的发病及恢复机制极其复杂,失语症的症状并不单单
人机交互(Human-Computer Interaction),简称HCI,是研究人与计算机信息交换过程的一门技术。人机交互技术的功能主要依靠具有输入输出功能的外部设备和相应的软件来完成。其
<正> 古地磁学是利用岩石或古物的剩余磁化强度,研究地质历史时期和考古时期地磁场变化规律的一门学科。基于它的理论意义,以及在解决一系列地质问题上的重大作用,这门新兴的
供应链系统是一个复杂的动态网络环境,其本质在于合作,但是合作是把双刃剑,带来利润的同时也必然会带来风险,而且任何一方面临的风险都会波及其他成员,一旦风险发生将使整个