基于免疫进化的分类型数据聚类算法的研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:lili1006
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年来,各种现代启发式优化算法,如模拟退火算法、遗传算法、粒子群算法等,被应用到一些实际工程项目和科学研究的优化问题中并取得的不错的效果。其中,免疫算法显现出在数据挖掘应用方面的巨大潜力。 本文在继承K-modes给出的相似度的确立思想基础上,加以改进,解决了K-modes算法中存在的类内相似度偏低的问题,并采用一种基于免疫进化机制的搜索策略来全局搜索聚类中心,建立了一种基于免疫进化的分类型数据聚类算法——ICCD(Immune-BasedClusteringAlgorithmforCategoricalData)。 本文在UCI数据集上对算法的准确性和效率等指标进行了测试。实验结果表明,算法在一定空间使用下可以实现高精度聚类分类型数据,且对分类型数据的数据量及维数有很好的可伸缩性;更重要的是,在聚类精度方面,ICCD较K-modes有了明显的提高。
其他文献
在移动互联网高速发展的今天,随着使用移动终端来获取、存储和处理数据信息的需求日益广泛与深入,传统的移动终端开发与数据存储技术已无法满足当今各种移动存储应用在平台独
随着计算机性能与网络传输能力的不断发展,人们在享受多媒体所带来的便利与乐趣的同时,正逐渐提升对多媒体数据的品质要求。超分辨率(Super-Resolution)技术正是针对图像、视
本文基于当前计算机系统的需求,选择一种新的计算思想,自律计算是让计算机拥有智能化的自我管理能力,具体主要包括自我配置,自我修复,自我优化,自我保护四个方面。自律计算能够解决
复杂网络作为近十年兴起的一门交叉性学科,受到来自不同领域研究工作者极大兴趣与广泛关注。对于社会学、计算机科学、生物学、神经学、经济学等诸多领域而言,借助复杂网络的理
E2xb算法是基于对攻击特征(模式字符串)进行检测(模式匹配)的入侵检测算法。它的原理是任何一个待检测的串(本论文称长度固定的待检测串为特征串),如果不包含某模式串的一部分
知识发现和数据挖掘是人工智能、机器学习、数据库和统计理论等相交叉形成的新学科,目的是从数据库中提取有用的模式,因而具有广阔的应用价值。然而,随着信息技术日新月异的
本文针对小设备的设备特性,以及小设备上协议栈实现的要求进行了讨论,并从IPSec/IKE的协议冗余性出发,提出了以IPSec/IKE协议精简为出发点的安全功能设计方案。 首先,介绍了小
一直以来,协议一致性测试是网络协议工程学中研究的热点。如何描述协议,并根据协议描述生成测试用例,是协议一致性测试领域中的关键问题。目前,统一建模语言(UnifiedModelingLang
计算机网络的发展和普及,使得有线网络和无线网络都在逐步走向IP化。IP多媒体子系统是3G移动通信技术的一个组成部分,能够支持语音、数据和多媒体应用等业务,为最终用户提供多媒
随着计算机技术的飞速发展,多媒体产品在人们的日常生活中变得越来越普遍,越来越重要,同时人们对其的要求也越来越高,图片要更清晰,虚拟场景要更逼真,甚至电影特技要更眩目。