基于粒度重要性的聚类集成算法研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:wangyuanshan3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类作为一种无监督学习,旨在发现一组模式、数据点或对象的自然分组。在聚类算法中,一个重要的问题是缺乏一种确定性的方法,用户可以根据该方法来决定哪种聚类方法最匹配给定的输入数据集。聚类集成作为一种知识重用,为解决聚类固有的挑战提供了一种解决方案。它试图在不访问数据原始特征的情况下,通过组合基本聚类算法得到的计算解来探索高稳定性和鲁棒性的结果。在面对聚类分析问题时,聚类集成已被证明是一种很好的选择。然而,现有的聚类方法大多对所有的样本都一视同仁,忽略了样本属于类簇的核心还是类簇的边缘,这是不合适的。在发现底层数据结构时,不同的样本扮演着不同的角色。在基聚类中,簇核心样本通常比簇边缘样本具有更一致的近邻关系,这两类样本在确定底层数据结构方面具有不同的贡献。因此,在聚类集成中,核心样本的挖掘和每个簇的核心结构对提高聚类结果起着至关重要的作用。此外,现有的加权聚类集成方法倾向于将每个基聚类视为一个个体,而忽略了同一基聚类内簇的局部多样性。如何评估簇的可靠性并利用集成中的局部多样性来提高共识性能是一个具有挑战性的问题。在此基础上,本文开展了如下的研究工作:一、本文提出了一种基于样本确定性指标和局部加权策略的聚类集成算法,该算法能够评估簇级别上的可靠性并利用集成中的局部多样性来提高共识聚类的性能。首先,我们发现样本在发掘数据底层结构时具有不同的重要性,在样本的层面上定义了样本确定性指标来衡量其在挖掘底层数据结构时的贡献,在此基础上引入了一种新的簇有效性度量,并提出一个局部加权的共协矩阵作为不同簇的集成。随着基聚类内部的局部多样性被引入到集成框架中,进一步提出了两个新的共识函数。实验结果表明,本文提出的方法优于其他主流的聚类集成算法。二、为了进一步提高算法的效率,本文提出了基于等价粒近似精度的聚类集成算法。该算法将样本划分为等价粒,通过降低数据规模来提升算法的效率,并使用一个新的模式来研究聚类集成。划分等价粒之后,聚类集成的研究也从样本层面提升到等价粒层面。我们引入粗糙集理论中的近似精度来度量等价粒在聚类时的贡献,并根据等价粒的近似精度值将等价粒分为核心等价粒和边缘等价粒。在核心等价粒上能够发掘一个清晰的簇结构,进而将边缘等价粒分配到已发现的核心结构中,以此来获得最终的聚类结果。通过可视化实验和大量的对比实验分别证明了该算法的合理性和出色的性能。综上所述,本文围绕样本在发掘底层数据结构有重要之分的思想,在不同的层面上使用不同的方法来衡量不同粒度在聚类时的重要性,并且使用不同的模式来研究聚类集成,由此提出了两种有效的聚类集成算法。
其他文献
遥感图像工厂提取作为计算机视觉领域中新兴的热点研究课题,不仅在学术上推动了建筑物提取和道路检测等遥感领域的理论研究,而且在工程应用上为城市规划管理、土地利用和地图更新等系统提供了技术支持。随着深度学习的快速发展,遥感图像的目标提取任务取得了突破性的进展,但其算法在工厂这一类别上由于特定的诸多挑战依旧难以发挥优越的性能,例如工厂外观上存在颜色、纹理、尺度的巨大差异性以及遮挡、阴影等挑战。另外,高分辨
学位
显著目标检测通过模拟人类视觉感知系统来定位场景中最具吸引力的目标,在实际应用中发挥着关键作用。虽然显著目标检测已经受到学者们的广泛研究并取得了极大的进展,但仍然存在着很多问题,比如场景复杂、光照条件不足、前景和背景相似等。深度(Depth)图像可以为RGB图像提供更多的空间结构信息,由此RGB-D显著目标检测应运而生。但RGB-D显著目标检测仍面临着如何有效利用两种模态信息的巨大挑战。为了解决这个
学位
STEM教育和初中科学实验教学都注重培养学生的实际动手能力,而STEM教育主张将科学、技术、工程、数学四个学科进行综合教学,以有效促进学生在不同领域的全面发展。教师可分析STEM教育理念在初中科学实验教学中的应用价值与现状,有针对性地实施教学。实践时,教师可先设计实验情境,唤醒学生的知识网络,再以讨论带动创新,引导学生设计实验方案,然后让学生探究实验步骤,并切实动手实践,最后整合学习资源,让学生复
期刊
三支决策是一种处理复杂问题的有效方法,符合人类处理信息的认知方式。其主要包含“分”、“治”、“效”三个步骤。“分”是将整体划分为不相交的区域,“治”是制定策略使对象在不同区域之间移动,“效”是优化三分法和策略以达到预期的结果,其中,分是基础,治是手段,效是最终的目的。“治”是三支决策中一个关键的环节,通常是制定移动策略使对象从不利区域中移动到有利区域中。现有移动策略主要有两种:一是将不利区域中的对
学位
胸部X光影像被广泛应用于胸部疾病的诊断与治疗。根据病人的胸部X光影像,医生需要通过影像中的表现给出细致的描述与诊断意见,最终形成一份诊断报告。随着影像技术的发展,影像科医生每天需要审阅大量的影像数据并为每一份影像撰写诊断报告,这占据了影像科医生的绝大部分工作时间。因此开展能够自动生成诊断报告方法的相关研究显得尤为迫切。大多数现有的医学影像报告自动生成的方法是先根据病人影像检测出疾病异常,然后根据检
学位
目的探讨髋臼有限加深、全髋置换术结合软组织松解、骨创治疗仪治疗成人股骨颈骨折及严重股骨头缺血性坏死伴髋关节骨性关节炎的近期疗效。方法对38例41髋成人股骨颈骨折、股骨头坏死、髋关节骨性关节炎患者实施了髋臼有限加深法非骨水泥假体全髋置换术并结合软组织松解、骨创治疗仪治疗。结果经术后6个月至5年6个月的随访,所有病人患髋疼痛消失,可以长时间行走,X线片示人工髋关节位置良好,假体无松动及明显下沉迹象,生
期刊
社会转型期,我国教育改革正不断向纵深方向发展。家校共育领域中,无论从政策落实到实践路径的优化,都非常期待家长能够以全新的姿态扮演好新时期教育利益相关者的角色。本文围绕家校共育中家长有什么样的责任?实践样态如何?如何保障与改进家校共育中家长责任的实现三个方面的问题展开探究。
期刊
学位
骨架是三维模型的一种紧凑的一维表示,可以将三维模型转换为更简单的表示形式。目前的骨架提取方法因为点云提供信息的稀少以及复杂的柔性变化,仍然不够稳定。因此本文研究探讨了非刚性点云间的基于稀疏匹配对的一致性骨架提取技术。首先在现有的单个点云曲线骨架提取技术的基础上提出了一种改进的方法,能够更好的提取出骨架。其次提出一种在多个形状中进行骨架协同提取的方法,使得多个点云具有一致的骨架结构。具体来说,本文主
学位
近年来,由于数据采集技术的快速发展,多视图数据在实际生活中越来越常见。多视图学习就是将多个视图的信息结合起来进行学习的方式,以获得更好的结果。然而噪声、数据采集的故障等许多无法预料的因素导致数据缺失,数据会在单个视图或多个视图中随机缺失,不完整多视图聚类就是对此类有缺失的多视图数据按照一定规则划分成几个簇的过程。以往的常规方法无法直接处理此类数据,因为它们都是在所有视图都没有缺失的的前提下进行学习
学位