基于蚁群算法的聚类分析方法的研究及应用

被引量 : 0次 | 上传用户:bobo20092009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由信息技术、网络技术的飞速发展所导致的“数据爆炸但知识贫乏”的现象日益严重,在这一环境下,数据挖掘应运而生并获得了快速发展,国内主流网站评比的未来十大热门技术中,数据挖掘技术占了一席之地。数据挖掘是一个多学科交叉的研究领域,涉及到数据库技术、人工智能、机器学习、统计学,知识获取、生物计算等多门学科的理论与技术,其发展必将大大影响全球信息化的进程,对其进行系统、深入、全面、详尽地研究是信息化发展的客观需要。而作为数据挖掘分析方法之一的聚类分析更是表现突出,在包括模式识别、数据分析、图象处理,以及市场研究等许多领域得到广泛的应用。本文对数据挖掘技术,尤其是聚类分析进行了较为系统的分析和研究,提出了一些想法和改进,主要包含以下内容:数据挖掘技术的概述。介绍了数据挖掘的概念,对数据挖掘的发现模式、数据挖掘的方法及应用进行了详细的分类、归纳和总结。聚类分析技术的概述。聚类是一种重要的数据分析技术,是数据挖掘理论框架中一个必不可少的部分,通过搜索并识别数据结合,从而描述数据,发现数据之间隐含的、有趣的相互联系。本文对聚类分析的定义、数据类型、聚类分析中的主要算法及度量标准作了简要的介绍和系统的学习。为本文的全面展开奠定了基础。蚁群算法的概述。蚁群算法是一种模拟群体智能的算法,在解决基于离散空间的问题时表现出良好的性能。本文由群体智能引出蚁群算法,并对蚁群算法的原理及特征做了简要的介绍。通过分析蚁群算法的优缺点,指出该算法的一点改进的研究方向。针对蚁群算法早熟、停滞及容易陷入局部最优等缺陷,借助蚁群算法与遗传算法相融合的思想并加以改进,将融合思想由解决离散域问题向更有效的解决连续域问题过渡,引出改进的基于交叉变异操作的蚁群算法,来提高蚁群算法的性能。提高性能的蚁群聚类组合算法的研究。在研究基本蚁群聚类模型的基础上,通过对公式、半径、空间分割的改进,借助于短期记忆的思想,提出了一种改进的基本蚁群聚类方法(ILF算法),通过改进,减少了参数的设置,降低了计算的时间,并具有较强的鲁棒性。结合K-means算法,提出了一种改进的基于信息素的K-means改进算法,通过对改进信息素的转移概率判断标准来进行聚类,减少了算法的参数个数,加快了聚类的进程。针对这两种算法的聚类特点,提出一种蚁群聚类组合算法策略,该策略首先利用改进的ILF算法来完成一次聚类过程,然后收集聚类结果样本,对样本数据再利用改进的基于信息素的K-means算法进行结果的后期优化处理,进行二次聚类过程,以此得到比单个算法更优的性能。最后对各种算法进行数据测试和性能分析,并把蚁群聚类组合算法用于银行信用卡客户的消费行为分析。
其他文献
本文首先通过运用波特5力模型对比分析中美长毛绒玩具行业格局,指出中国长毛绒玩具代工生产(OEM)企业转变经营战略,建设品牌的重要性。以S公司的发展历程及目前所遇到的困境
期刊
建立于1872年的美国黄石公园是全世界第一个国家公园,也是屈指可数的世界最大的公园之一,面积22万余英亩,园内道路总长500多英里,小径总长1000多英里,迄今已有6000多万人前来
随着网络时代市场竞争的加剧,产品开发的生命周期日益缩短,同时影响产品开发过程的因素也日益复杂化与专业化。因此设计分工的细化,考虑因素的众多,设计大师的概念也日趋符号
工程的质量是建筑行业的根本,工程质量的优劣不仅仅关系到建筑企业的经济效益和声誉,更直接影响着人民群众的生命安全和国家的民生大计。因此,建设工程监理是建筑业发展过程
日本歌曲中使用频率最高的词山西太原王英斌日本歌曲中哪些词的使用频率最高呢?最近,日本的一家广告代理店对昭和年代最受人们欢迎的2700首歌曲的歌词进行了分析。分析结果表明,使用
<正>日语中的“重言”,词典中注有三层意思。一是重说一次,例如:■
基于混沌同步原理和方法,针对Lorenz电路,设计了两种混沌自同步电路,并用Multisim2001对电路进行仿真比较。观察到了预期的同步效果,获得了更加直观的认识和理解。
养殖业近十几年在我国已经得到迅速的发展,在为广大城乡居民提供丰富的肉制品的同时,也产生了大量的养殖污染,其中畜禽粪便污染最为突出。利用现代堆肥技术将猪粪堆制成有机
目前寄宿制高中学校的学生只有双休日在家。很多学生家长与自己孩子的交流会出现一些困难,每个父母都希望5天的学校教育和2天的家庭教育能形成合力,达到5+2≥7的教育效果,我