基于网格的聚类融合算法的研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:qq351660
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
组合分类方法己被证明是非常普遍和有效地、能够改进学习精确度的监督方法。依据同样的原理,聚类融合的目的是融合来自多个划分的结果以得到更高质量和鲁棒性的聚类结果。目前已经出现了很多的聚类融合算法,大量的理论和实验研究表明:与单个聚类相比,聚类融合具有明显的优势。在众多的聚类方法中,基于网格的方法以网格为单位学习聚簇,速度快、效率高,但它构造的每个聚簇边界成锯齿状,不能很好地识别平滑边界曲面。本文在对已往聚类融合算法进行深入分析的基础上,并结合网格聚类算法的优缺点,提出了一种基于网格的聚类融合算法:旋转网格(Rotation Grid,简称RG)。该算法能够有效地解决网格聚类方法中边界处理不平滑问题,RG算法有两个关键的步骤:(1)生成若干个具有差异性的聚类成员;(2)设计融合函数对聚类成员进行融合。本文围绕这两个方面进行了研究。在生成聚类成员方面,RG不是通过随机抽样数据集或随机初始化相关参数来创建有差异的聚类成员,而是迭代的将特征划分为K个数据子集,并使用特征变换得到K个不同的旋转变换基,形成新的特征空间,并将网格聚类算法应用于该特征空间,从而构建有差异的聚类成员;在设计融合函数方面,算法沿用了基于超图的思想,将聚类成员中的每个簇写成单位向量形式,将每个向量看作顶点,构造一个带权超图。依次计算出所有顶点对之间的边权重,并找出边权重最大的两个簇,用相同的标签来标示,然后用投票的方法决定数据集中的每个点所在的簇。通过大量的实验表明,RG算法能够有效地划分任意形状、大小的数据集,并能有效的解决网格聚类中边界处理过于粗糙的问题,其精度明显高于单个网格聚类。
其他文献
随着生物信息学的大力发展,研究者们不断地在探究基因调控规律,而不能深入的理解转录调控规律已经成为研究调控网络的瓶颈。目前,转录因子结合位点识别问题已成为生物信息学
网格计算是近年来信息技术领域的热点研究课题,它是指在动态变化的异构环境中,共享资源和协作解决问题。由于网格具有大规模、异构、动态、分布和自治等特性,在网格计算中如
近年来,随着Internet的飞速发展,网络安全的要求也越来越高。尤其是现在流行的Web服务,对服务器的安全性要求也越来越高。传统的安全保障技术,诸如防火墙、杀毒软件等,虽然可
学位
随着万维网进入人们的生活,网络已成为人们获取信息和资源的主要来源之一。然而如何在具有海量、半结构化或非结构化、动态性和多态性等特征的信息中方便、迅速、准确地检索
近年来,随着信息技术和数据仓库技术的发展,数据挖掘作为一个全新的信息处理技术迅速发展并逐步走向成熟。数据挖掘就是一种从大量的数据中提取新颖的,隐含的,有效的信息的高
近年来,随着互联网技术的不断发展,互联网上所承载的数据流量出现了爆炸式的增长。为了应对新业务、新应用对网络的要求,传统网络变得越来越复杂,越来越难以适应未来的发展。
随着人工智能技术的不断发展与完善,人脸表情识别逐渐成为人工智能和人机交互领域的一个重要研究方向,具有深远的理论意义和应用前景。实现计算机的人脸表情识别将更好地推动
无线Mesh网络(Wireless Mesh Networks, WMN)是一种多跳、具有自组织和自管理能力的宽带无线网络结构,已经广泛应用到企业、校园、医院及旅游等应用领域。随着网络信息论的引
水泥水化过程是一个极为复杂的过程,水泥水化计算机模拟作为水泥材料研究的一个方面,对于研究并预测水泥性能有重大意义和实用价值,是目前科学研究的重点。美国NIST的CEMHYD3