复杂数据的集成聚类算法研究

来源 :山西大学 | 被引量 : 2次 | 上传用户:chae888888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
集成聚类技术由于具有较好的泛化能力,已引起了研究者的高度关注。目前,在集成聚类领域已经取得一些显著成果,针对不同的应用需求提出了不同的集成聚类算法。然而,已有算法能够处理的数据类型比较单一,而实际应用中面临的数据往往是兼具数值属性和分类属性共同描述的混合型数据,往往还存在着特征值缺失,数据规模海量,多视图等问题。因此,复杂数据集成聚类算法的研究具有非常重要的意义。  本文针对具有数据类型混合、特征值缺失、多视图等特征的复杂数据的集成聚类问题进行了较为深入的研究,主要研究内容如下:  (1)介绍了集成聚类技术的整体过程,并对该过程中最关注的两个问题,详细总结并分析了现阶段已有的一些典型算法,同时对评价聚类有效性的三种比较流行的度量指标进行了介绍。  (2)提出了一种不完备混合数据集成聚类算法。该算法首先利用3种缺失值填充方法对不完备混合数据进行完备化处理;其次在3种填充后的不同完备数据集上分别多次执行K-Prototypes算法产生基聚类结果;最后对基聚类结果进行集成。在UCI真实数据集上与传统聚类算法通过实验进行了比较分析,实验结果表明提出的算法是有效的。  (3)提出了一种多视图数据集成聚类算法。该算法通过在类的层次上进行集成来提高算法的计算效率,并且定义了一种新的类间相似度度量方法来解决多视图数据特征空间不一致的问题。在真实的多视图数据集上与传统集成聚类算法通过实验进行了比较分析,实验结果表明提出的算法是有效的。  本文提出的两种集成聚类算法同时兼顾了聚类精度和运行时间,有效解决了实际应用中广泛存在的复杂数据的集成聚类问题。研究成果为复杂数据的集成聚类提供了新的策略,进一步丰富了复杂数据的聚类分析的研究。
其他文献
无线传感器网络作为一种新兴网络,其巨大的应用前景以及潜在的科研价值吸引众多国家、机构、企业、公司竞相展开了对无线传感器网络关键技术以及应用的研究与开发。路由协议作
随着互联网上Web服务大量涌现,在语义层面上挖掘并分析Internet上Web服务间竞争或者协作关系将是构建新的、基于相关关系的服务管理、服务发现及服务组合算法的基础。在利用本
传统起搏器监测方法受制于信号频率、功耗、监测方式等因素,因而在进行实时监测时难以应对大量起搏心电数据的采样、处理与传输。压缩感知理论可以进行信号的低功耗采样,实现
网络漏洞(Network Vulnerability)是网络安全研究的一个重要研究领域,网络漏洞分析(Network Vulnerability Analysis)技术是网络漏洞研究的基础,而报文处理(Packet Processing)
随着信息技术的迅猛发展,人类生活中存在各式各样的大规模网络。复杂网络的广泛存在,使得对其研究变得非常必要。而对复杂网络的研究包括复杂网络拓扑结构统计特性及分析、复
随着信息通讯技术的发展与云计算的普及,以平板电脑,智能手机为代表的组织型云端设备逐渐成为人们生活的必需品。区别于传统计算设备,由功能相同、结构相似的云端设备构成的组织
分组调度算法对网络性能和网络服务质量有重要影响。基于轮循的调度算法是应用最广泛的分组调度算法类之一,DRR算法是其中的经典,SRR算法是DRR算法的一种改进。DRR算法和SRR
人脸识别技术是一种生物特征识别技术,由于其数据采集的友好性、面部的客观性以及应用场景的多样性,使其已成为模式识别与深度学习方面的研究热点。但人脸识别在具体应用过程
热点话题的发现一直都是自然语言处理领域常见的研究课题。在网络舆情监控方面,需要实时发现老百姓讨论最多的新闻事件,特别是网民对网络突发性事件的热议。及时对这类事件进
相对于我国古代先进的建筑技术成就,我国在古建筑的计算机建模还比较落后,急需利用现代信息技术手段,对古建筑的保护和开发进行探索和研究。本文选取唐朝风格的古建筑(简称古