【摘 要】
:
从大量的已知数据中挖掘出隐含在其内的、潜在的、有用的信息和知识的技术即为数据挖掘。聚类作为数据挖掘领域中一个活跃的研究课题,是分析数据并从中发现有用信息的一种重要手段。已存在的聚类算法中,蚁群聚类算法是群体智能算法在聚类中应用的产物,它主要是根据蚁群尸体堆积和寻找食物源这两种群体行为启发而来。LF聚类算法便是产生于尸体堆积的行为模型,蚂蚁会将死亡的蚂蚁堆积成堆。本文对传统的基于蚁穴清理的LF算法进
论文部分内容阅读
从大量的已知数据中挖掘出隐含在其内的、潜在的、有用的信息和知识的技术即为数据挖掘。聚类作为数据挖掘领域中一个活跃的研究课题,是分析数据并从中发现有用信息的一种重要手段。已存在的聚类算法中,蚁群聚类算法是群体智能算法在聚类中应用的产物,它主要是根据蚁群尸体堆积和寻找食物源这两种群体行为启发而来。LF聚类算法便是产生于尸体堆积的行为模型,蚂蚁会将死亡的蚂蚁堆积成堆。本文对传统的基于蚁穴清理的LF算法进行了深入的研究与分析,并提出了改进算法,做的主要工作如下。(1)概述了近年来有关蚁群聚类算法的改进以及应用。详细介绍了不同蚁群聚类算法的工作原理与算法模型,并比较了两种不同模型的优劣,为文章的改进算法做了理论基础的铺垫。(2)针对传统的LF蚁群聚类算法中存在的收敛速度慢,蚂蚁空载导致的资源浪费以及易陷入局部最优等问题,提出了一种蚁群改进算法。算法初期采用直接分配原则,直接将蚂蚁随机放在数据对象上,并生成随机的全局记忆,在聚类时负载蚂蚁移动受到全局记忆的指导,利用余弦相似度判断最相似的记忆中心,并向该记忆中心移动,全局记忆在一次迭代完成后更新。当蚂蚁拾起数据对象失败时,采用相异原则将蚂蚁移动到下一个数据对象上。实验结果表明:新算法在保证原有算法准确率的基础上明显提高了收敛速度。(3)为了改进LF算法参数依赖过多,算法初期迭代速度慢等不足,提出了一种信息熵的全局记忆的LF蚁群聚类算法。新算法引入了信息熵的概念改变了原有LF算法中蚂蚁判断拾起或放下数据对象的规则,避免了传统规则中产生随机数对算法的效率及稳定性产生的影响,最后在算法运行的不同时期加入不同的邻域半径。实验结果表明:新算法能有效的减少参数依赖,提高了算法的稳定性。
其他文献
能源危机与环境危机是21世纪人类面临的两大重要挑战。利用光催化转化CO2为碳氢化合物的技术,不仅可以减少大气中CO2的含量,还可以将太阳能转化为太阳能燃料。近年来,新型催
本文研究是以DPD工业园区的发展为例,将DPD工业园区的实际发展情况与现代管理学中最为经典的理论相结合,寻找出DPD工业园区现在存在的各种主要问题以及影响DPD工业园区发展的
随着电子商务的发展,越来越多的个人和商业组织开始阅读和参考在线评论来做出购买决策。积极的评论可以为企业和个人带来显著的经济收益和名声,这为虚假评论的产生提供了强大
铝(Aluminum,Al)在酸性条件下被活化,从而会显著抑制植物生长和产量。目前,随着全球土壤酸化问题日益加剧,铝毒害成为制约农作物产量提高的主要限制因素之一。因此,植物响应铝
软土在我国沿海地区广泛分布,由于软土具有天然含水量高,抗剪强度低,压缩性高的特点,因而开展工程建设时需要对软土地基进行加固处理。透水刚性桩集合了排水固结法和复合地基
在当今信息化时代,数据量呈指数规模上涨,分析数据的手段和工具层出不穷,如何有针对性的计算数据的统计特征、发现海量复杂数据中隐藏的数据演化规律始终是数据分析领域中的
本论文依托国家自然科学基金资助项目(61401203)、中央高校基本科研业务费专项资金资助(30918012203),开展了对嵌入式平面麦克风阵列测向技术研究。然而嵌入式平面阵列中各阵
燃料电池作为新一代汽车产业的环保、高效的发电装置,相较于传统的车用内燃机,卡诺循环对其造成的负面效果很小,使其能量转换效率大约可以提高30%~50%。在燃料电池的核心结构
在人工智能领域,建立视觉理解和人机交互之间的联系是一项具有挑战的任务。目前深度学习技术广泛应用在计算机视觉和自然语言处理等领域,虽然基于深度学习的视频自动描述生成
随着磁浮列车相继在上海、长沙和北京的商业化运营,磁悬浮技术在现代的交通运输领域受到了广泛关注。然而,悬浮控制系统作为磁浮列车的核心部分,其性能评价研究仍处于空白阶