基于遗传算法的层次化聚类方法研究

来源 :中山大学 | 被引量 : 0次 | 上传用户:junee1122
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析是数据挖掘的重要研究领域之一,在工程、商业、生命科学、社会科学以及其他许多领域得到了广泛的应用。但由于聚类对象在高维特征空间分布的复杂性,聚类效果评价的不确定性和灵活性,以及聚类作为一个优化问题求解的高计算复杂性,使得聚类算法仍然面临着众多的问题和挑战。 本文针对聚类中自适应确定聚类个数、目标函数灵活定义及聚类优化的近似计算等问题,利用了分裂式层次化聚类算法能根据相似度阈值自适应地确定聚类个数的特点,并结合二进制遗传聚类算法具有较强的搜索近似最优解能力以及目标函数定义灵活的特点,提出了一种基于遗传算法的分裂式层次化聚类方法(GABasedDivisiveHierarchicalClusteringAlgorithm-GADHC)。在实验研究中,一方面针对不带类别标签的交通状态数据采用GADHC算法进行聚类,发现了若干类典型的交通状态模式,验证了GADHC算法的有效性;另一方面,针对几个标准的带类别标签数据集,采用GADHC算法、GAClust及K-Modes的算法进行聚类,通过聚类结果错误率的比较分析,验证了GADHC算法具有较好的聚类性能。
其他文献
基于计算机的过程控制系统已经被广泛地应用,随着互联网技术的发展,互联网在控制领域表现出巨大的应用潜力。作为下一代控制系统的基础,基于互联网的过程控制系统的设计是控
主动激光视觉系统具有直接三维成像的特点,将其用于飞行器、汽车等移动装置完成避障、导航信息的获取,实现自动驾驶或辅助人工驾驶已引起人们的重视。论文中主要是针对主动激光
WWW 是一个开放性的全球分布式网络,网上的资源没有统一的结构和管理,导致了信息查找和使用的困难。网页的自动分类可以在较大程度上消除网上信息杂乱的现象,并方便用户准确
虽然在单机时代已经提出了并发性的概念,但在分布式系统日益广泛应用的今天,并发性的重要性无疑是更大了。然而,可靠而高效的并发软件比顺序程序更难以开发。并发软件的设计
当前,Web服务研究已经成为一个热点,相关的技术不断涌现,如:SOAP、WSDL、UDDI、XLANG、WSFL等。这些技术大大推动了web服务的发展,也不断提出新的挑战。目前用于开发web服务
随着纸张生产量的飞速提高,传统的靠人眼来对纸张质量进行逐一检测已经不能满足市场的需要,一种基于机器视觉的印钞质量在线检测系统就因应而生。在现代印钞造纸企业,要力争实现产品质量的提高和生产效率的提高。而实现这些目标的三大重要基础就是生产自动化、检测智能化与管理信息化。印钞质量在线检测系统将这三方面相结合,相比传统的人眼检测而言显示了机器视觉图像处理技术的优势。该系统能够对产品质量进行智能自动化检测和
随着社会进步和互联网络的快速发展,Internet已经达到大约有80亿个网页和560亿个超链接的规模,并且随着时间推移,其网页的数量和超链接的规模将来会变得更加庞大。如何让这个
随着数据库应用的不断深入,需要透明地访问和处理来自多个数据源中的数据的需求越来越多。但是,大多数数据源在物理和逻辑上都存在着很大的差异。传统的数据集成技术,已无法适应
本文作为“支持隧道代理的主动防御型防火墙的研究”的一部分,首先对防火墙技术的基础知识以及身份认证在防火墙系统中的重要性作了简要说明,然后叙述了目前国内外主流防火墙
虚拟现实技术在这几年来越来越得到国内外广泛学者的关注,并且它拥有广泛的应用前景。三维场景的构建是虚拟现实技术中的一个重要组成部分。在三维场景构建中场景建模技术、建