聚类集成研究与应用

来源 :贵州大学 | 被引量 : 1次 | 上传用户:iamwoceo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析的目是将数据自动划分成有意义的分组。不同的聚类算法在相同的数据集上运行会得到不同的结果,没有一种单独的聚类算法能够在所有的数据集上找到最好的划分。聚类集成的出现很好的解决了上述题。聚类集成由两个阶段组成:生成有差异的聚类成员,利用一致性集成获取最终聚类结果。通过设置单个聚类算法的不同参数,采用数据子集或者数据的子空间产生聚类成员。一致性集成则是将多个聚类成员生成的结果转换成共协矩阵或簇关联矩阵,最后利用层次聚类,超图划分等方法来获取最终聚类结果。首先本文利用自编码器和ClusterDP算法产生聚类成员,使用WOMC算法对聚类成员进行集成,得到EClusterDP算法。在投票法中使用聚类成员的权重信息相对比较容易,但是这类算法都严格限制聚类成员产生数目相同的簇,这将导致生成的互信息矩阵中元素差异较小,进而使得聚类成员的权重比较接近影响加权效果,本文基于不限制聚类成员生成相同簇数量的算法LCE,利用抽样的方法将聚类成员的权重引入LCE算法中。在集成规模扩大,不能明显提高聚类结果时,使用加权的方法能有效的提高聚类结果,接着本文研究利用k-means算法进行特征转换的图像分类算法,由于k-means算法易受初始点影响,且容易陷入局部最优导致算法不稳定,本文通过对k-means算法进行聚类集成,找到更好的数据表达,提高分类准确率。
其他文献
随着互联网的高速发展,越来越多的网络主机相连,网络服务需求已超过了网络的服务容量,对具有QoS(Quality of Service)服务的应用产生了严重的影响,如视频点播、IP电话等。选播是
信息技术的迅速发展加快了企业的现代化与信息化的进程。计算机技术与管理科学的结合促进了现代企业管理技术的形成。现代企业管理技术的目的是通过现代管理模式与计算机管理
高校图书馆网站作为网络信息资源的集散地,利用网络传播的优势,极大地促进了信息的传播,有力地支持了教学科研。但是,当前不少高校图书馆网站缺乏可用性评价体系的指导,存在访问率
随着以计算机和软件为核心的数字化技术的迅猛发展,多媒体技术与因特网的应用迅速普及,传统的信息服务方式逐步被信息通信计算机网络所代替,数据共享成为一种必然要求。实现数据
随着信息技术的飞速发展,大量信息因应用背景的不同被保存在各种数据源中。这些数据源既包含各种关系数据库,也包含在电子政务中大量使用的基于COM组件的数据源。在互联网相
我国电力工业发展迅速,变压器数量激增,相关数据越来越庞大,借助智能技术对变压器进行故障诊断势在必行。本文对基于蚁群算法的变压器故障诊断进行了深入研究,做了以下工作:(1)完成了变压器故障诊断系统的设计,该系统采用了专家系统,其主要功能包括:信息采集模块、数据分类存储、综合管理模块及分析诊断等。对变压器故障诊断系统进行了分析,这种结构的系统具有高效、可靠、易于维护等优点。(2)蚁群算法(ACO)已经
随着网络和多媒体技术的飞速发展,电信企业对视频监控产品的要求也越来越高。随着网络的发展,各个视频监控系统间的互联互通问题成了制约视频监控系统发展的一个重要因素。如
当今计算机技术已进入以网络为中心的发展时期,由于客户/服务器模型的简单性、易管理性和易维护性,客户/服务器计算模式在被大量采用。伴随着近年来新兴的富媒体(RIA)技术和软件
随着对螺旋桨性能要求的不断提高,传统的螺旋桨设计方法已经满足不了进一步提升其性能的要求,并且现代环境的变化不再仅仅要求螺旋桨某一性能的最优,而是多方面综合性能的最优,螺
课堂考勤是高校教学管理中必不可少的手段之一,而传统“签到”的方式不仅费时费力,而且效率较低。随着移动互联网的发展和4G时代的到来,智能手机已成为人们生活必不可少的一部分