自适应加权可能模糊聚类及鲁棒算法研究

来源 :西安邮电大学 | 被引量 : 0次 | 上传用户:jakey17866747
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,聚类分析算法逐渐成为数据挖掘技术领域的重要工具。对于聚类算法如何提高其准确划分程度和处理数据时的抗噪鲁棒性一直是这一领域的研究热点。模糊理论因其具有解决不确定性问题的潜在能力而被广泛应用于聚类分析。因此,将模糊理论应用聚类算法能增强算法处理各种复杂数据的有效性和适应性,为聚类分析理论体系的进一步发展提供了新的研究方向。模糊C-均值聚类(FCM)算法已经广泛应用于聚类分析,它对不含噪声的图像和数值数据具有很好的聚类效果。但是FCM算法只考虑了当前样本的聚类,对噪声和离群点非常敏感,其抗噪鲁棒性较差。可能模糊C-均值聚类(PFCM)算法同时解决了FCM算法的抗噪能力弱和可能C-均值聚类算法(PCM)容易出现聚类中心重叠的缺陷。这是因为PFCM的目标函数同时包含了隶属度和典型性两个重要特征,并分别赋予其系数a和b。但是系数a和b的取值只能依靠大量重复实验,以便获得算法所需的适当参数值,增加了算法的不确定性和时间开销。因此,本文将在可能模糊聚类算法的基础上对其加权系数进行改进和优化,以便增强其聚类精度、抗噪性能和适应性。本文的主要工作概括如下:(1)为解决可能模糊聚类算法中典型性和隶属度参数选取不合理导致聚类中心出现重合的缺陷,本文在加权可能模糊C-均值聚类算法(WPFCM)的基础上,提出了一种基于最大熵方法构造的自适应加权可能性模糊聚类算法(AWPFCM)。根据迭代过程中隶属度和典型性的不同权重分配来更新其权值参数,进一步增强了算法的聚类精度。同时,用Zangwill定理分析了算法的收敛性。此外,为了确定该算法的最佳聚类数,本文构造了三个适应本文算法的有效性指标函数。最后,通过鲁棒损失函数来优化AWPFCM算法中的欧氏距离进一步提高算法的抗噪鲁棒性,提出了RAWPFCM算法。实验结果表明,AWPFCM在数值数据聚类和图像分割方面都具有明显优势,比现有的可能性聚类算法有更好的性能,所提出的有效性指标也能准确的确定该算法的最佳聚类数,RAWPFCM算法具有很好的抗噪性能。(2)为进一步增强对高维复杂数据集的有效聚类,本文进一步将算法推广至核空间,采用高斯核函数优化原有的欧氏距离度量,增强算法对高维数据集的聚类性能,从而提出了基于核空间的自适应加权可能模糊聚类算法(KAWPFCM)。此外,为了准确确定该算法的最佳聚类数,构造了三个适应该算法的有效性指标函数。最后,通过鲁棒损失函数来优化KAWPFCM算法中的高斯核距离,进一步提高了算法的抗噪性能,从而提出了RKAWPFCM算法。实验结果表明,KAWPFCM算法对复杂数据集的聚类性能优于现有的可能模糊聚类算法,所提出的有效性指标也能准确的判定该算法的最佳聚类数,RKAWPFCM算法也具有很好的抗噪鲁棒性。(3)由Lambert W-函数驱动的增强可能性模糊聚类是一种重要的加性划分聚类方法,但如何有效地选择模糊聚类和可能性聚类的加权指数是该聚类算法面临的一项挑战性任务。本文首先将最大熵原理引入到增强可能性模糊聚类中,提出了一种由Lambert W函数驱动的自适应熵加权可能性模糊聚类。然后构造了所提出算法的三个有效性函数,用于自动找到不同数据集的最佳分类数。最后,利用鲁棒损失函数对所提出的算法的距离度量进行了修改,得到了具有加权熵正则化约束的鲁棒增强可能性模糊聚类算法,最终解决了受噪声污染的数值数据的聚类问题。实验结果表明,在大量噪声干扰情形下,提出算法可准确获取原有数据的真实聚类中心,具有良好的抗噪鲁棒性。同时本文的工作极大地促进了可能性模糊聚类理论的发展,对实际应用具有深远的意义。(4)为进一步提高Lambert W-函数驱动的增强可能模糊C-均值聚类算法(EPFCM)的聚类性能,将其推广至核空间,提出了基于核度量和Lambert W-函数驱动的自适应加权可能模糊聚类算法(KAEPFCM)。有效提高了算法的聚类精度和处理复杂高维数据集的能力,同时应用鲁棒损失函数模型来优化所提出的可能性模糊聚类的原有核诱导平方欧氏距离,并构造了具有熵正则化的鲁棒增强核化可能性模糊聚类算法,以便有效处理含有大量噪声的复杂数据集。最后,为了广泛应用该算法,设计了多个有效性函数来解决该算法自动确定最优聚类数的问题。实验测试结果表明,提出算法的聚类性能优于许多模糊聚类相关算法。
其他文献
模数转换器(Analog-to-Digital Converter,ADC)是片上系统(System on Chip,So C)中的一个关键模块单元,在电子系统中起着至关重要的作用。相比于其他类型的ADC,逐次逼近型(Successive Approximation Register,SAR)ADC中的电路模块大多为数字电路,具有集成度高、功耗低和面积小等优势,在可穿戴智能传感、生物医疗电子等需要
学位
眼底疾病是一种严重的眼部疾病,包括青光眼、白内障、视网膜病变等,若未能及时有效的治疗,将会对视力造成不可逆的伤害,甚至致盲。因此,早期准确诊断眼底疾病是避免视力损害和治疗的关键。然而,眼底疾病早期不典型、不易被察觉,人工诊断存在着费时、费力、主观性强等缺陷。随着医疗大数据和人工智能技术的发展,为眼底病变的自动诊断提供了可能。但是,现存的眼底病变自动诊断算法存在着准确性偏低、漏诊率偏高、忽略病变之间
学位
发动机动力不足已经成为影响我国大部分装备性能的重要因素,随着动力技术的不断发展,对涡轮增压器的工作性能、使用可靠性和稳定性提出了更高的要求。在怠速工况和正常工况下涡轮增压器受温度、压力等条件的影响,涡轮增压器容易出现泄露、密封环失效等问题。因此,对涡轮增压器密封装置在怠速工况和正常工况下内部流场进行数值模拟仿真,对密封装置密封环进行流固热耦合计算至关重要。针对涡轮增压器密封装置,本文做了如下工作:
学位
随着“中国制造2025”战略的逐步推进过程中,我国的模具企业在长期发展后进入了转型的关键阶段。然而,基础零件的三维建模规范模糊、同时,模型知识管理不够科学,让我国数量较多的轻工模具企业难以切实提升自身的产品研发能力。针对轻工模具基础零件三维模型在实际中所存在的建模方法不规范、模型查找困难、重用不便等问题,本文从数字化建模的方向着手,将模型的高效管理和准确重用视为目标,从轻工模具基础零件数字化建模和
学位
女性主义运动以及社会对女性群体的关注,使得女性群体成为了各类研究的对象。随着女性自我意识的觉醒,该群体逐渐进入到社会经济领域参与社会生产活动。新闻媒体担任着政府耳目喉舌的角色,同时也是公众认识世界、了解世界的窗口。中国新闻网作为中新社的官方媒体,承担着对内对外报道的重要职责,其职业女性报道彰显了一定的传播价值。本研究的研究主体定位于“职业女性”,将其定义为参与社会生产活动的女性,以中国新闻网为研究
学位
复式行星齿轮传动系统在越来越多的机械装备中得到广泛应用,在车辆、航空等领域发挥着巨大作用,其性能好坏直接影响设备的健康寿命与运维成本。齿轮齿面在高负载工况下会演化出磨损、胶合等故障,而这些故障产生的振动激励又会通过各传递路径反作用于系统,加剧系统磨损速率,影响设备运行。因此对复式行星齿轮箱进行故障诊断与状态监测,对由内部激励造成的振动故障主要传递路径进行识别,提升齿轮箱的可靠性是非常必要的。本课题
学位
为减少机械的停机时间和故障造成的二次损伤,近年来,齿轮传动系统的故障检测与诊断引起了极大的关注。与简单行星轮系相比,复式行星轮系结构更紧凑、传动比范围更大,被广泛应用于航空、航天、风电等机械中,对复式行星轮系进行故障诊断具有现实意义。目前,在机械故障检测与诊断领域,基于振动信号的故障诊断技术是应用最为普遍的技术。但是,在实际应用中,带故障信息的振动信号往往湮没于健康装备的振动信号和背景噪声中,因此
学位
随着数字经济的快速发展以及手机等移动智能终端的广泛使用,短视频逐渐成为越来越多未成年人休闲放松的选择之一。短视频平台虽具有开阔未成年人的眼见、丰富其生活等优势,但也带来未成年个人信息隐私泄露及违法使用、不良内容污染未成年人身心健康,以及未成年沉迷网络等巨大风险。短视频行业发展飞速,相应的政策、法律规制也需与时俱进及时跟紧,为未成年用户提供全面系统的制度保障。本文运用了文献研究、对比研究、深度访谈等
学位
目前国际上和风力发电相关的研究大体上可以分为两类:海上浮式平台风力发电和陆上固定平台风力发电。相对来说,很少有人关注它们之间的那部分——内陆湖面上的风力发电。本文针对我国内陆湖泊和水库设计了一种小型风光互补的驳船型浮式平台,对湖泊上的风能和太阳能进行回收利用,并对该浮式平台的水动力响应进行研究,提出了一种以太阳能浮式平台来稳定风机浮式平台的策略。本文主要涵盖以下几部分内容:第一部分,基于CATIA
学位
“健康中国”是党和国家着力推动的重大战略,健康传播作为这一战略中的重要支撑,对推广健康理念、提升健康素养、实现全民健康具有重要意义。当下,短视频的兴起为健康传播提供了全新舞台,以其灵活多样的时空维度、直观生动的场景优势、丰富多元的信息表达,让健康传播更加大众化、生动化、显性化。四川大学华西医院是国内顶尖的医疗机构,抖音是备受瞩目的新兴媒体平台。本文选取“四川大学华西医院”抖音号为研究个案,以“知、
学位