改进的蚁群聚类分析算法的研究

被引量 : 0次 | 上传用户:oliversong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据聚类是重要的数据挖掘技术,是人们认识和探索事物之间内在联系的有效手段,它既可以作为独立的数据挖掘工具,发现数据库中数据分布的一些深入信息,也可以作为其它数据挖掘算法的预处理步骤,且在工程和技术领域具有广泛的应用背景。近几十年来,国内外的研究者们提出了许多聚类算法,力图发现最优方案。随着蚁群算法研究的兴起,人们发现在某些方面采用蚁群模型进行聚类更加接近实际的聚类问题。本文首先分析了聚类分析和蚁群算法。聚类分析是数据挖掘中的一个很活跃的研究领域,主要用于在隐含的数据中发现有意义的数据分布和数据模式。对聚类分析的定义、聚类的方法、数据类型以及聚类结果的度量标准作了简要的介绍。蚁群算法模拟了群体智能,在解决优化处理方面发挥了很好的作用,研究了蚁群聚类分析基本模型和蚁群聚类分析基本模型的LF算法,分析了其算法的优缺点。本文对基于蚁群算法的聚类分析方法及其应用展开了研究,主要工作如下:1、提出了基于信息素的改进的LF算法(ILFBP)。由于LF算法要设置很多的参数,并且对参数设置比较敏感,同时由于定义了蚂蚁在二维网格中是任意移动的,任意移动过程中对某些区域并没有数据对象,而且算法收敛速度过慢,所以算法的聚类效果不好、效率不高。通过在改进LF算法中群体相似度函数,加入参数的自适应调整策略,利用短期记忆和网格信息素的局部分布控制蚂蚁的随机移动,并结合蚂蚁速度动态变化、半径递增、强制放下等特性,提出了基于信息素的改进的LF算法。2、对改进的算法进行分析,并且通过测试数据和不同的算法进行了对比实验分析,证明了改进算法的有效性,算法显示出了较高的稳定性和准确率。3、提出了蚁群聚类文档挖掘系统结构。在典型的文档挖掘流程基础上,分析和设计了蚁群聚类文档挖掘总体结构和文档分词子系统、文档特征向量计算子系统及蚁群聚类分析子系统结构。
其他文献
以促进区域产业升级与土地资源优化配置为目标,采用案例分析与模式总结法,研究了珠江三角洲村镇产业用地整合的策略与模式。结果表明,珠江三角洲村镇产业用地的整合不是简单
伴随现代生活观念的转变,人们对日常生活环境提出了更高要求,在城市道路规划设计中引入"绿色"这一概念非常必要。通过在道路、城市中心、居民区等车辆人口密集区域建立带状的
森林公园旅游环境承载力评估是一个复杂的问题。一方面受到诸如景区自然环境特征和组成结构、景区经济环境背景和社会文化环境、旅游者的行为特征及人口学特征等诸多指标的影
随着经济快速发展和社会竞争加剧,大学生的心理健康教育问题已成为大学生思想政治教育的重要内容。目前高校心理健康教育与思想政治教育存在着师资队伍薄弱、体制不够健全、
TNF-α是炎症反应中最常见的一个炎症因子,它不仅可以激活放大炎症反应,还可以诱导细胞的凋亡。其诱导的炎症反应与现代常见的动脉粥样硬化、脑缺血、类风湿关节炎等疾病有关
目的比较托吡酯(topiramate,TPM)快速负荷与咪达唑仑(midazolam,MZ)治疗难治性癫持续状态(re-fractory status epilepticus,RSE)的临床疗效。方法将57例RSE患儿按不同的治
英国Imaje公司是一家大型基于先进喷墨技术的编码和标记设备提供商。凭借其自有的企业级软件解决方案,Imaje的设备广泛应用于各种生产线。由于客户对生产线集成需求的不断增长
随着信息技术和互联网技术的飞速发展,多媒体信息量增长越来越快,视频信息量更呈现爆炸式增长。如何有效地管理和利用这些海量视频数据成为当前的研究热点,而人们对多媒体信
目的观察中药联合氨甲喋呤(MTX)治疗异位妊娠的临床疗效。方法运用随机数字表法将72例异位妊娠患者分为联合组和对照组各36例,对照组单纯采用氨甲喋呤50mg/m^2肌肉注射,必要时5—7
随着世界商品经济一体化的发展,现代广告作为国际商业活动的推动力,其地位不断提升。广告利用各种传播媒介广泛地传递信息,旨在达到宣传目的,即引发公众的消费欲望和购买行为