基于蚁群优化的聚类算法的研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:lengyubo88
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘(Data Mining)是在海量的数据中提取隐含在其中的有用信息和知识的过程。数据聚类(Data Clustering)是其中一项重要的数据挖掘技术,是人们认识和探索事物之间内在联系的一种有效手段。它既可以作为独立的数据挖掘工具,发现数据库中数据分布的一些深入信息,也可以作为其它数据挖掘算法的预处理步骤,且在工程和技术领域具有广泛的应用背景。聚类(Clustering)就是将数据对象划分到不同组(Group)/簇(Cluster)中,使得属于同簇内的数据对象具有相似性,而不同簇的数据对象具有相异性。 本文在充分研究了现有蚁群聚类算法的基本原理与特性的基础上,为了提高算法效率,改善聚类质量,经过对引入信息熵的蚁群聚类算法的研究、归纳和总结,提出一种改进的基于信息熵的蚁群聚类算法。主要思想是尽可能赋予蚂蚁以智能行为,一方面将蚂蚁在聚类过程中的一次迭代活动的比较区域半径逐渐增大,以此减小空间内数据疏密程度的变化对算法进度造成的影响;另一方面,在引入信息熵的聚类算法以避免基于蚁巢分类模型的聚类算法中蚂蚁随机拾起/放下数据对象的基础上,又引入了观望策略来引导蚂蚁移动的方向,代替随机移动的策略,将蚂蚁活动与周围的信息熵环境紧密地联系在一起,利用蚂蚁对历史若干组(视数据规模等条件而定)熵信息的记忆和更新,来改善传统的随机方向选择机制对算法效率的影响。 本文的研究具有一定的理论和实践意义。通过实际数据集的实验表明,改进后的算法有效地提高了聚类的质量,并在一定程度上减少了算法的迭代次数,有利于算法效率的提高。
其他文献
准确、大面积、实时的估算地表土壤湿度是“渤海粮仓”科技示范工程的一项重要内容。传统的土壤湿度获取是基于地面站点监测,精度高、时间连续性好,但获取的是点尺度数据;遥
21世纪是信息的时代,一方面,信息技术高速发展,改变我们的生活方式,提高我们的生产效率,另一方面,信息安全事件不断发生,威胁我们的生命、财产安全。信息安全阻碍了信息技术
在人工智能的研究领域中,许多实际的应用问题,如知识表示、自动推理、机器学习、规划以及自然语言处理技术等,都具有不确定性和复杂的关系结构双重特征。统计概率方法能够有效的
Wimax(Worldwide Interoperability for Microwave Access)是一项技术先进的无线宽带网络,世界上各大IT公司都不断在研发该产品。虽然目前各大公司都已经推出了Wimax的一套完
随着万维网技术的快速发展和普及应用,多媒体已成为人们经常使用的信息载体。在万维网上除了普通文本之外,还有大量的图像、视频、音频、动画和图形等,对这些媒体类型的信息
数字化影像设备在临床的广泛应用产生了大量的医学图像数据。如何更有效地组织、管理和检索医学图像数据,让丰富的医学图像更好的为临床、科研和教学服务成为当前迫切需要解决
数字化是一场全世界范围内的产业技术革命,数字技术已经广泛渗透到社会生活的各个领域。作为数字技术重要分支的数字电视技术是继黑白电视和彩色电视后的第三代电视技术。由
全文检索是现代信息检索技术的一个非常重要的分支,它是处理非结构化数据的强大工具,也是搜索引擎的核心技术之一。本文对中文全文检索的有关技术进行了较为深入的研究。在基
随着数字多媒体技术的发展和应用及其在互联网上的广泛传播,人们越来越容易获取这些数字媒体产品。然而,便捷的网络环境也使得非法占有、复制、修改和传播未授权产品的侵权行
随着计算机的普及和网络应用的飞速发展,主机与网络安全成为人们关注的重要问题,病毒木马与杀毒软件在相互超越中不断发展。越来越多的后门程序深入到系统内核隐藏自身,在用户不