基于高斯核的KSOFM聚类算法研究

来源 :桂林理工大学 | 被引量 : 0次 | 上传用户:ldbeight
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析作为数据挖掘中十分重要的一个组成部分,逐渐被许多商家和企业所应用,而聚类分析在一定程度上,受到数据源中待分析数据的线性与非线性制约,在遇到数据之间存在非线性关系时难以得到比较精准的结果。本文主要针对非线性数据提出一种基于核方法的神经网络聚类算法。论文完成了以下工作:描述数据挖掘起源以及数据挖掘组成部分,分析了经典数据挖掘步骤,并介绍了相关内容。还对数据挖掘中的聚类算法进行了关键性研究,对比了数种经典聚类算法,并得出神经网络聚类中的SOFM算法相比较其他算法而言有着较高的可靠性,如信息处理的并行性、信息单元的互连性,非线性,能够很好的处理普遍存在的非线性问题,具有较强的自学习、自组织与自适应性等等。并详细研究了核方法,并对常用的核方法进行了介绍。对核函数性质以及选择核函数原则进行了细致的分析,通过对三类重要的核函数进行比较,选择了其中的平移不变核函数,因为高斯核函数的特征空间是无限维的,所以任意样本在映射到特征空间后必将是线性可分的,故而将高斯核函数作为算法改进中所使用的核函数。   本文在对核方法进行了较为详细的了解与学习后,对引入核方法之后的KSOFM算法做出了详尽的说明,并设计出了一种新型的基于高斯核函数的神经网络聚类算法KSOFM算法。通过前期对聚类算法以及核方法的研究,在理论上说明了,将输入空间中的数据映射到高维特征空间中,然后在高维特征空间中进行聚类,与一般的映射后再聚类法相比,KSOFM算法精炼许多,在时间复杂度上也较低,因为KSOFM不需要求出映射空间,实际处理的数据集还是原始数据集,只是将相似性度量函数映射到高斯核空间来满足核聚类的要求,所以相比传统的维度变换聚类得到的效果较好。为了说明设计的新算法的实效性,在MATLAB环境下对SOFM算法和改进后的KSOFM算法进行了实验仿真,其结果证明了改进后的KSOFM算法具有可行性且具有实际效果。为了能够清楚地显示聚类效果,给定数据集已经经过人工分析得出需要的聚类结果,随着高斯核函数中径向选择宽度常量σ的变化,结果也发生着明显的变化,并在某个特殊值时获得十分良好的可容误判率。
其他文献
2018年我国电力行业将遇到新的挑战和任务,持续增强电网建设,保证和提高电网安全可靠性和运行经济性是电网工作的重中之重。而精准的电网母线负荷预测将直接影响到电网安全预警分析、电网输送能力计算、运行计划方式安排、发电计划编制、安全约束调度、无功优化调度以及最优潮流分析结果等,对节能发电调度中的有阻塞管理和安全校核等重要环节也起着重要的基础性作用。目前已经有大量学者对母线负荷预测模型做出了研究,但都存
学位
由于大型线性方程组在化学工程、天气预报、数值方法等领域中都有广泛应用,使得对其求解的研究一直是个热点。随着科学技术的迅猛发展,人们所需要处理的数据量迅速增长。虽然
在科技不断进步的今天,伴随着信息应用领域如多媒体信息技术的迅速发展,以及Internet技术的日益普及,数字图像的来源可谓越来越广泛。面对如此大规模的图像数据库数据,我们不
近年来,随着在线音乐库的蓬勃发展,用户希望通过自动索引方式找到他们喜爱的音乐,通过音乐来舒缓现代社会快节奏、高竞争压力下的心境和情绪,已经成为一种时尚。音色识别,是
近些年,随着互联网的快速发展和网络终端的多样化,网络新闻报道快速增长,新闻信息的结构变得更加复杂。传统的新闻收集、整理、组织和分析工作很难全面的了解新闻报道之间的
在当今社会中,计算机技术被越来越多地应用在在行人导航、大型场馆的人员疏散、时空环境下的交通网络优化、交通网络的评价分析等方面,它们可以统称为时空优化问题。但是在具
支持向量机(Support Vector Machine, SVM)最初于20世纪90年代由Vapnik提出,它采用和传统方法不同的统计学习理论(SLT)为基础,是借助最优化方法解决机器学习问题的一种数据挖
无线多媒体传感器网络的可用频谱有限且通信中干扰严重,如何保障多媒体数据传输的服务质量,是其面临的重要挑战。论文引入认知无线电技术,以满足多媒体流传输的实时性和带宽
使用存储虚拟化技术能够更加充分地发挥存储区域网SAN系统可用性强、扩展性好等特点。在基于带外SAN架构的存储虚拟化系统中,元数据服务器负责整合异构的存储资源和组织元数
随着国民经济的快速发展,各行各业对电能质量的要求不断提高。电力系统无功优化是保证系统安全、经济运行的一种有效手段,是降低网络有功损耗、提高电压质量的重要措施。因此