基于改进BP估值的缺失数据模糊聚类算法研究

来源 :辽宁大学 | 被引量 : 0次 | 上传用户:Luke_ibox
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在实际数据聚类中,经常遇到数据缺失的问题,造成数据缺失的原因主要有:测量误差,数据理解有误或数据漏读等。如果对缺失数据处理不恰当,就会严重影响聚类结果的准确性。因此,对缺失数据聚类问题的研究具有重要意义,并且得到了国内外学者的广泛关注。本文针对模糊C均值算法不能直接用于缺失数据聚类的问题,提出了一种基于改进BP对缺失属性估值的模糊聚类算法。本文采用最近邻规则为缺失数据选择训练样本集,并根据缺失数据的属性缺失特点对选取的训练样本进行缺失处理,处理后的训练样本会包含缺失数据。因此,需要改进BP神经网络使其适用于缺失训练样本集,本文提出了基于缺失数据的BP神经网络(MBP)。利用最近邻训练样本集为每个缺失属性训练MBP网络,然后对缺失属性进行估值预测,最后得到MBP估值恢复后的完整数据集,对恢复后的完整数据集进行模糊聚类分析。针对MBP网络估值后得到缺失属性的估计值是数值型的,但是数值型估值不适于描述缺失属性的不确定性,并且有一定的误差。本文提出了根据MBP网络对缺失样本进行估值时,得到的对完整属性估计误差值,将缺失属性的数值型估值转换成区间的形式,同时,也将完整属性表示成区间的形式。从而,将数值型数据集转换成区间型数据集进行模糊聚类分析,得到最终的聚类结果。最后,采用人工数据集和UCI机器学习基准数据集中的Wine,Bupa,Breast三个数据集在MATLAB平台下进行仿真实验,实验结果表明,采用MBP对缺失数据进行估值得到恢复数据集的聚类结果与对比方法相比准确率有所提高,而采用估值区间进行聚类比数值型估值聚类结果更准确,鲁棒性也更好。
其他文献
初中化学教材中的插图是教材的重要组成部分,能直观地表达一些信息,具有很强的艺术性,可以淋漓尽致地将一些用文字难以表达清楚的现象表现出来,同时,插图也比较简捷、生动,容易引起
英语教学中千方百计优化课堂教学结构,不断创新和实践,形成全新的课堂教学模式,促使其听、说、读、写能力不断发展,从而提高英语课堂教学质量。
信号传输链路是卫星监测系统的重要组成部分。目前卫星监测系统中信号传输链路普遍采用规则金属波导传输系统,该系统存在铺设工作量大、需要配备附属设备和维护难度大等缺点。本文首先分析了以光纤传输系统作为信号传输链路的优势,并进行了大量相关实际测试后发现,光纤链路用于卫星监测信号传输,不但能使系统构架更为简单,后期维护更加简便,而且有效减小被传输信号的失真度,是未来卫星监测链路发展的重要趋势之一。
期刊
近年医疗费用的过快增长,使看病难、看病贵问题已成为社会各界关注的热点,而要让人民群众享有高质量、低费用的医疗服务,关键在于能否建立起比较科学、合理的管理模式和支付
肺结核病是人体感染结核菌之后引起的一种慢性传染病.肺结核病需长期治疗,长期的住院治疗费用很大,必然加重了病人及家属的经济负担,早在20世纪60年代中期,一些经济不发达国
期刊
<正>近日,宁夏青铜峡市首届"青峡绣女"生态移民手工艺精品展销推介会圆满结束。展销会吸引了10余家企业及百余名妇女带来了近5000件精美作品前来参展,有效推动了该市手工艺品
高考事关千家万户,高考加分政策必然备受关注。近年来关于高考加分的负面新闻接踵而至,对于高考加分政策的存废问题引起了广泛的关注。本文试从介绍我国高考加分政策的基本情
随着以多媒体技术和网络技术为核心的信息时代的来临,课堂教学的教学形式和手段也需要随之发生改变。多媒体课件的多维化、实用性,得到了师生的认可。信息社会的时代背景下,
目的:筛选和验证氟作用下大鼠骨肉瘤细胞差异表达的miR-23a,利用miR-23a表达载体和miR-23a反义寡核苷酸探讨miR-23a对染氟UMR-106细胞成骨活性的影响。方法:1、染氟UMR-106细