模糊C均值聚类算法有效性函数集成方法研究

来源 :辽宁科技大学 | 被引量 : 0次 | 上传用户:flywate
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
模糊C均值(FCM)聚类算法是机器学习中使用最频繁的算法之一。FCM聚类算法是一种无监督学习的方式,并不需要预先知道数据集的先验知识,因此如何确定最佳聚类个数成为决定聚类结果质量的重要条件。而且对于模糊聚类算法来说,模糊划分的引入使其比硬聚类算法更符合现实数据集的结构。因此研究模糊聚类有效性评价方法具有重要的意义。目前,模糊聚类有效性的研究主要体现在模糊聚类有效性函数(FCVI)和组合式模糊聚类有效性评价方法(CFCVE)两个方面。本文基于这两个方面分别评述了一些FCVI以及CFCVE,并依据模糊聚类有效性函数的共同点和不同点进行了细节的归类,分析了不同模糊聚类有效性评价方法的研究现状和构成策略。本文根据基于模糊聚类有效性的研究现状提出了4种用于解决模糊聚类有效性评价的方法如下所示:(1)提出了一种新的FCM聚类算法有效性函数(VHY)来验证聚类结果的有效性。VHY基于模糊隶属度矩阵中的类内紧凑度、类间分离度、类间数据相似性和数据集的几何结构来定义,其最小值表示最优聚类划分结果。并且在4组人工数据集和6组UCI数据集上将VHY与7个传统聚类有效性函数进行了实验对比。仿真结果表明,VHY可以更准确地得到数据集的最优聚类数,并且在改变模糊加权指标的情况下仍能找到准确的最佳聚类数,具有较强的适应性和鲁棒性。(2)对聚类有效性的研究大多是基于单一的聚类有效性函数。研究表明,没有一个聚类有效性函数能够处理任何数据,并且总是比其他指标表现得更好。为此,提出了一种基于FCM聚类有效性函数的混合加权组合评价方法(HWCVF)。HWCVF的加权方式采用专家赋权与信息熵赋权组合的形式,既能克服专家加权的主观因素影响,还可以弥补信息熵加权对各聚类有效性函数值判断中的不足。同时本文还对组合方式进行一定的探讨,包括线性、指数、对数和比例四种聚类有效性函数组合方法。最后,通过人工数据集和UCI数据集来验证HWCVF的应用性。实验结果表明,提出的HWCVF可以克服了单一聚类有效性函数的缺点,能够更准确地得到不同数据集的最优聚类数。(3)组合式有效性函数虽然可以在一定程度上对单一有效性函数进行融合,但是权重的选取过于困难,因此提出了一种基于D-S证据理论的模糊聚类有效性函数集成模型(DS-CVFFM)。DS-CVFFM首先采用FCM聚类算法作为基础算法,计算不同有效性函数的值,然后使用聚类有效性函数作为构造基本概率分配函数(BPA)的证据源。最后,通过D-S证据理论的融合规则计算不同聚类个数取值的信度值,根据决策条件,输出最佳聚类数。DS-CVFFM使用的信息融合进而集成多个聚类有效性函数用于判断最优聚类数,无需提出复杂的有效性函数,避免了加权组合中专家因素的影响聚类有效性评价方法。最后,使用4组人工数据集和14组UCI数据集验证所提出DS-CVFFM的可行性。实验结果表明,与传统的模糊聚类有效性评价方法相比,提的出DS-CVFFM具有重要的应用价值,不仅提高了判断最优聚类数的准确性,还在不同的模糊指数值条件下提高了稳定性,可以克服传统聚类有效性的缺点评价方法。(4)聚类集成是研究聚类问题的重要手段之一,其思想是通过多个聚类算法输出单个聚类结果进而提升最终聚类的质量。判断聚类结果的好坏需要进行有效性评价,现有的聚类有效性函数同聚类算法一样仅能适用于部分数据集,其稳定性还有待提升。为此基于D-S证据理论、多个FCM聚类算法和多个模糊聚类有效性函数提出一种新的聚类集成模型(DSMFCE)。DSMFCE通过不同算法更新聚类中心与隶属度方式的不同从而使其具有更强的适应性。然后将各算法对应聚类中心与隶属度输入到有效性函数中,再将有效性函数作为命题通过D-S证据理论进行信息融合,最后通过决策模块输出最佳聚类个数的取值。在新的模型概念中,文章着重探讨聚类算法,有效性函数及D-S证据理论的组合框架,通过串联与并联两种集成方式来验证最终聚类集成模型的有效性。最后选取6组人工数据集与14组UCI数据集进行实验仿真,实验结果表明DSMFCE在多个FCM聚类算法集成的条件下,对最佳聚类个数的判断具有很好的稳定性与适应性。
其他文献
随着社会的进步和现代医学的发展,急诊的地位日益突出,急诊是医院的窗口,急诊护理作为急诊工作的重要组成部分,是衡量医院整体水平、服务质量、应急能力的一个重要标准。由或于急诊患者病情危重、病情进展迅速,要求急诊护士必须具备专业的急救知识、精湛的急救技能、熟练的操作能力。同时由于急诊工作高风险高压力,导致高年资护士调换岗位辞职,急诊护士普遍年轻化,专业水平高低不一,同时医院急诊科室工作环境复杂、服务对象
会议
我国的高速铁路正飞速发展,截止2020年12月,我国的高铁运营里程已达3.6万公里。高速铁路在给人们的出行带来了巨大便利的同时也对线路运行的安全性提出了更高的要求。随着高铁运营速度不断提高、运能密度的加大,已有大量的现场案例说明高速铁路的扣件存在伤损,从弹条断裂到弹性垫板老化失效等问题严重威胁了高速铁路运营的安全。扣件弹条是连接钢轨和轨道板的重要部件,也是在高铁轮轨高频激励作用下最易发生失效的主要
学位
随着“互联网+”大时代的到来,地铁行业的互联网化已经成为必然趋势。客流数据也随着时间的积累形成了庞大的数据库,挖掘大数据下隐藏的有价值的信息用于服务业务的决策及行业的发展,是大数据时代的核心战略。自上海宣布全网刷码进站,轨道交通互联网+行动得到了又一次进展,同时也带来了新的客流特征。因此,采用人工智能技术手段,从客流特征入手,可以更为深入、全面地了解乘客出行行为,挖掘乘客的潜在出行需求及出行特征。
学位
受到人类活动和自然因素的作用,水土流失等灾害现象日益频发,受到研究学者的关注和研究,水土流失的监测与评估已经从小范围小流域逐步走向了大范围、连片区域性治理,因此需要从多角度、多层次和多维度地了解地表区域性的水土流失变化情况。在众多的土壤水土流失模型中,相比于降雨因子、土壤地质因子、地形因子、植被覆盖因子、地质水文因子。地形因子是最为重要的分析参数,直接影响到区域水土流数学模型的计算精度。本文结合青
期刊
近年来,随着电子商务的迅猛发展,快递业务量呈高速增长态势,为物流产业带来了前所未有的机遇。然而,快递分拣跟不上业务增长的需求,大多中小型快递分拣中心仍然采用人工方式,不但容易造成误拣,且效率低下。因而,尽快实现快递的自动分拣,是亟待研究的课题。基于此,本文引入机器视觉,详细研究了快递派件信息码图像的检测和识别技术,并设计了快递自动分拣软件系统。主要工作和创新如下:(1)在传统图像算法的基础上,提出
学位
<正>核战略是使用核武器的军事战略,是国家安全战略的重要组成部分,包括核武器的研制、发展和使用。俄罗斯军队自组建以来,其战略核力量就一直是国际社会关注的焦点和世界各国研究的热点。从“单纯防御”“积极防御”到“现实遏制”,俄罗斯核战略一直在发展演变,回顾这一发展演变过程,对我们理解俄罗斯核战略逻辑、认清当前态势、把握发展趋势、增进力量建设等具有一定的参考价值和借鉴意义。
期刊
随着中国信息化第三阶段的展开,各行各业开始发展以计算机为主的智能化新生产力,由计算机辅助决策大大提高了工作效率,为生产力进一步发展提供了技术支持。有轨车辆作为第二次工业革命就诞生的运输工具,也应该顺应信息化时代的浪潮,形成覆盖广泛的信息链路和并具备自我环境感知能力。这不仅符合有轨车辆自身发展的内在需要,也是国家和社会对安全运输、信息化运输的外在要求。虽然传统双目视觉系统或其他感知设备为矿用机车防撞
学位
注意力缺失和多动障碍(Attention Deficit Hyperactivity Disorder,ADHD)是一种典型的精神功能障碍病症,普遍发生于儿童期,具有社会危害性。目前,对于ADHD病症的检测主要通过父母和儿童的调查问卷、量表以及医生临床视诊,具有很大程度的主观性,且极其容易造成误诊和漏诊。而针对ADHD病症的计算机辅助诊断应用极少,所以采用人工智能技术快速准确地检测ADHD病症,对
学位
我国轨道交通运营线路里程居世界首位、运营规模位居世界前列、客运量也是全球第一。驾驶员是轨道交通运营的关键作业人员,其精神状态直接影响运营安全,而长期的长时间驾驶工作使得驾驶员的身体状态发生改变,其也伴随着决策能力、运动协调和注意品质等素质能力的下降。一旦出现紧急状况,驾驶员的应激反应决定其是否能沉稳有效地解决问题,因此有必要通过监测驾驶员心生理情况、评估其应激能力状态,在意外发生的时候,及时采取恰
学位
<正>党的十九届五中全会对推动经济体系优化升级、推动绿色低碳发展等作出重要部署,要求全面提高资源利用效率、提升产业链现代化水平、加快数字化发展。目前,以人工智能、大数据、物联网、5G和区块链等为代表的新一代信息技术日臻成熟,并加速向各领域、各行业全面融合渗透,成为推动传统产业转型升级、可持续发展的重要驱动力。2020年,住房和城乡建设部等部门印发了《关于推动智能建造与工业化协同发展的指导意见》《加
期刊