基于Fisher线性判别率的特征加权聚类算法的研究与应用

来源 :江苏大学 | 被引量 : 0次 | 上传用户:h597144280
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术、数据存储技术和数据库技术等飞速发展,特别是互联网技术的广泛应用,个人电脑和互联网服务器上每天都会出现海量数据。从这些数据中挖掘出有价值的信息以指导政府和商业公司的进一步工作,即数据挖掘,就显得非常具有实际意义和商业价值。   聚类作为数据挖掘的一个重要研究方向,可以有效地挖掘出这些数据背后所包含的知识。由于传统的聚类方法在聚类过程中,对数据对象的特征同等看待,即对所有的特征赋予相同的权重;而实践表明,数据对象的聚类效果往往取决于特征的某个子集,即不同特征在聚类中的贡献度不同。同时,传统的聚类方法的聚类结果刚性地把数据归为某一类,而实际情况证明,一个数据往往有不同可能性的分类结果。针对以上两个问题,本文在介绍了国内外相关研究现状后,利用Fisher线性判别率的思想计算特征的贡献度,对特征加权及其图像分割应用进行了深入研究。   本文的主要工作如下:   1.介绍了数据挖掘的基本理论,包括数据挖掘的概念、过程和研究内容。讨论了数据挖掘中聚类分析的概念,主要聚类算法的分类及其实现原理。   2.详细分析了K-Means聚类方法的聚类过程、实现原理。研究了Fisher线性判别率的基本原理,实现过程,经典应用。并将依据Fisher线性判别率计算特征贡献度的思想应用到K-Means聚类方法中,实现了加权K-Means聚类。在人工和实际数据集上所做实验表明,本文所提方法在聚类效果上优于所比较的原始K-Means算法,w-K-Means算法及FWAS-K-Means算法。   3.分析了模糊度的概念,思想及实现过程。将模糊度的思想应用到加权K-Means聚类中实现了加权模糊K-Means聚类。将该算法应用于图像分割领域。图像像素按照隶属度的不同,进行加权聚类,所得图像分割的实际结果表明,本文所提方法在分割图像效果上优于原始模糊K-Means分割算法,Bootsrap加权模糊K-Means分割算法。  
其他文献
归档存储系统中元数据操作占所有操作的50%~80%,高性能的元数据管理策略对归档存储系统的性能非常重要。但常用的基于目录子树分区和哈希的元数据管理算法不能适应和利用归档存
由于单隐层的前馈神经网络可以实现对任意非线性函数的映射,所以前馈神经网络(FNN)被广泛的用于函数逼近和分类等问题。BP算法在最优值附近的局部范围内可以较快地搜索到最优
纹理合成指的是由一个小的样图产生一个任意大的纹理图像,样图和结果图像应该被观察者认为是同一种纹理,并且在结果图中不存在明显的接缝问题,纹理合成的结果应该是非周期的
与生命体类似,一个软件也要经历孕育、诞生、成长、成熟、衰亡等阶段,软件开发模型作为描述软件开发、活动和任务的结构框架能清晰、直观地表达软件开发的全过程,明确规定了
随着Internet的普及和电器的智能化和网络化,一种连接各种电子设备、特别是移动和无线设备的普适计算模式正在形成,服务发现协议在这种网络的发展趋势中应运而生。服务发现协
物以类聚,人以群分。今天,面对互联网上日益增长的数据,聚类在数字图像处理、物种类别分析、网络社区发现、信息安全监测、企业商务智能决策和文本数据挖掘等领域得到了越来
通用游戏是人工智能最具挑战性研究领域之一。近年来得到快速的发展,在军事行动、电子商务、商业流程管理等方面有巨大实用价值。通用游戏的目的在于设计一个只接收游戏的游
灾害性天气的预报和警示在人们的生产、生活中具有举足轻重的地位。天气的历史数据和预报员的经验往往对气象预测的结果起着重要作用,通常预报员可以根据当前的天气情况和历
随着数字化信息时代的到来,越来越多的数字化产品普及到了人们的日常生活。虽然数字化技术对信息的处理、传播和复制了提供极大的便利,但同时它也带来了一些负面效果,如版权
在传统的TCP/IP协议中,IP地址同时表示节点身份与位置,存在语义过载问题,导致核心路由表扩张,移动性差,多宿主等诸多问题,基于位置/标识分离思想是解决该问题的方式之一。但