基于SOM和AIS的聚类算法研究

来源 :北京师范大学 | 被引量 : 0次 | 上传用户:xiaohuzhao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是为了满足人们对数据中所蕴涵的信息和知识的充分理解和有效应用而发展起来的一门新兴技术。其中,聚类分析作为数据挖掘的一项主要功能和任务,成为了数据挖掘中的一个重要的研究领域,至今已提出了大量的理论和方法,取得了丰硕的研究成果。尽管如此,聚类分析中还存在许多问题,尤其是随着数据挖掘技术的广泛应用,数据挖掘所面对的数据对象同趋复杂,聚类研究也面临更多新的内容和挑战。这就要求对现有的聚类技术进行改进,同时不断提出新的聚类理论和方法以适应新的应用。 本文对数据挖掘的聚类方法进行了简单的总结,特别对基于人工免疫系统和人工神经网络的AIS和SOM这两类现有的聚类算法进行了深入分析,从而提出了混合这两种基本算法的AISSOM聚类算法。主要内容如下: 第一部分简单介绍了数据挖掘聚类算法的发展以及特点。 第二部分对现有的聚类方法进行了总结,论述了目前主要的聚类算法。 第三部分概述了人工免疫系统的主要内容,和其在数据挖掘中的作用。详细讨论了两种著名的人工免疫系统RLAIS和aiNET,并对它们的特点进行了分析。 第四部分概述了自组织映射的神经网络系统的主要内容,及其在数据挖掘的应用。详细讨论了该系统的特点。 第五部分提出AISSOM这一新的聚类算法,对该该算法流程,和特点进行了分析和讨论。 第六部分实验对比。分别用SOM,AIS和AISSOM这个三种聚类方法在Iris,SCCIT和Breastwn这三个数据集上进行聚类实验,并对结果进行对比。通过四个指标来说明AISSOM的聚类准确性。 最后对现有工作进行总结和展望。
其他文献
随着网络和计算机技术的飞速发展,电子邮件凭借其方便快捷的特性,成为了一种广泛普及的网络信息交流工具,个人、企业和政府机关使用电子邮件进行通讯得到了大范围的推广。然而随
在科学研究和工程应用中的各个领域存在着大量的优化问题,进行最优化方法的研究具有重要的理论意义和实用价值。在现实生活中我们通常遇到的问题往往是多目标优化问题,即要同时
在由计算网格节点和应用网格组成的中国国家网格计算环境下,由于网格节点的访问控制机制,文件只能被特定的节点访问,而不能接受全网格用户的直接访问。当前的网格文件传输服务没
为了在网络中为大量用户提供高效的视频点播服务,基于流媒体的缓存和调度技术,针对不同网络结构以及所要满足的不同服务,本文提出一些新算法。主要贡献和创新点如下:   1.提出
近年来,随着计算机通信技术和网络技术的飞速发展,出现了一种新的数据模型—数据流。与传统的数据模型不同,数据流的特点是:(1)数据流是无限的,无法完整的存储;(2)数据的传输
k-匿名方法是视图发布条件下防止数据隐私泄露的一种重要方法,准标识符值是影响k-匿名表隐私保护程度和数据质量的关键因素,如何在给定各个准标识符属性泛化树的情况下求解准
下一代网络通过控制层设备屏蔽底层异构网络,向上提供开放的业务接口,引入了独立于网络运营商的第三方业务提供商。它的出现大大缩短了业务生成周期,并使得丰富多彩的跨网业务和
近十几年来,随着数字图像获取设备日益成为生活便利品,计算机存储介质成本不断降低,互联网络技术迅速发展,同时随着人们对视觉媒体日益关注,互联网上数字图像的数量和种类正在以前
学位
图像分割是将图像划分成多个具有相似特征的区域,并提出感兴趣目标的技术与过程,图像分割是图像理解和图像识别的前提,计算机视觉中的一个经典难题,也是图像处理和计算机视觉领域
从大量繁杂的文本信息中获取有用的信息是信息处理的一大任务,文本分类是实现这个任务的最重要的方法之一。而文本分类的前提在于文本的表示和特征项的选择。因为在文本分类