属性加权及不完备数据的模糊聚类方法研究

来源 :大连理工大学 | 被引量 : 16次 | 上传用户:jingfei1415
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
模糊聚类是模式识别领域的研究热点之一,主要用于识别数据内在结构。相似性度量是模糊聚类算法中的一个关键问题,常用方法,如欧氏距离、海明距离等,隐含假定样本的属性对聚类的贡献均匀,具有一定的局限性;另外,由于获取数据的限制、随机噪音等原因,往往造成样本属性缺失,而多数聚类方法无法直接对这类数据集进行聚类分析。因此,本文研究属性加权及不完备数据的模糊聚类方法。本文的主要工作概述如下:1.针对属性加权模糊聚类问题,提出了基于属性权重区间监督的模糊聚类算法,解决了权重确定的合理性问题,进而提高算法聚类性能。首先,从认知和数据集信息复杂性的角度出发,提出在聚类问题中采用区间数描述属性权重,由区间层次分析法获得属性对聚类的贡献度,相对于数值型属性权重更能提高权重表示的鲁棒性;其次,通过对属性权重与隶属度、聚类中心的迭代优化进行聚类分析,提出若权重计算结果超出区间约束,将其强制为区间中心值后再参与迭代计算,并设定最大强制次数以保证算法收敛。仿真实验表明,算法能够避免迭代计算陷入不必要的局部极小解,得到了更为准确的聚类结果。2.针对不完备数据模糊聚类问题,提出了基于最近邻区间的不完备数据聚类算法。首先,鉴于缺失属性的不确定性,本文依据不完备样本的近邻信息提出了缺失属性的最近邻区间描述;其次,基于最近邻区间描述,提出了两种不完备数据聚类算法。第一,将不完备数据集转化为区间型数据集进行聚类分析,算法所得聚类中心为属性空间中的超凸多面体,能够在一定程度上反映数据集子类形态,有利于得到更切实际的聚类结果;第二,鉴于最近邻区间描述能够将缺失属性估算限定在合理范围内,提出了遗传算法—模糊C均值的混杂框架,利用遗传算法在区间范围内搜索缺失属性的优化估算值,进而通过模糊C均值算法对“还原”后的完整数据集进行聚类分析,该算法在合适的缺失属性估算值基础上能够获得更为满意的聚类结果。3.针对现有不完备数据模糊聚类算法未考虑样本各属性对聚类贡献不同的问题,提出了基于属性加权的不完备数据模糊聚类算法。首先,利用经典算法对不完备数据集进行一次聚类,得到较为准确的缺失属性估算值和样本类别;其次,利用ReliefF算法对“还原”后的完整数据集进行属性评价;最后,通过加权欧式距离将属性权重引入聚类分析,实现缺失属性及聚类结果的一体化求解。仿真实验表明,所提算法通过强调重要属性的作用能够明显提高不完备数据的聚类效果。
其他文献
物体识别是当前国内外计算机视觉领域一个活跃的研究方向,物体识别的本质就是建立一个能够识别出图像中感兴趣物体类别的计算系统,在现实生活中有着广泛的应用需求,具有相当
本文在脑的四个功能系统学说的基础上,提出脑区能态理论,研究有意识、无意识和潜意识.讨论有意识、无意识、潜意识的脑机制,指出有意识、无意识、潜意识的统一性.
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
摘要:工程教育专业认证对资源勘查工程专业的课程建设提出了加强工程实践能力培养的新要求。针对《全球油气分布》课程在解决复杂问题的工程实践训练不够,迫切需要加强工程实践能力培养的问题,在课程教学目标、内容和方法等方面进行了积极的改革和实践。在教学目标方面突出了运用知识解决问题的能力和实践设计能力。在教学内容上进一步凸显课程的广度、典型性和实践性的特点,重点突出盆地油气勘探的实践,并以大量的油气藏的实例
通过分析医联体建设的趋势,借医联体建设的契机,通过急诊医学的平台,更好的发挥医院急诊科在医联体建设中的作用,从而更好的为患者服务。
随着信息科学的迅猛发展,信息技术在会计核算与财务管理中得到了广泛应用。现代信息技术给单位财务管理和内控制度提供了全新的管理模式,把财务数据、经济活动与经济业务纳入统
动物从军,自古有之。现代象棋中的马,可以说就是古代动物参战的反映。动物跃上战场,不仅给单一的步卒画面增添了壮丽的色彩,而且常常可以取得意想不到的战果。公元前284年,战
期刊
介绍了国内近几年在试验和理论方面对半刚性连接钢框架抗震性能的研究现状,归纳其研究成果得出:半刚性连接钢框架具有较好的抗震性能.并指出研究中存在的不足,对存在的问题提