基于邻域粗糙集的属性约简算法研究

被引量 : 0次 | 上传用户:nmg_zl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机技术、网络和存储技术的快速发展,使得数据获取和存储变得越来越容易,从而加剧了海量数据集的产生。这些海量数据中往往包含有大量冗余的、不确定的和不完整的信息,严重影响人们从中获取有用的知识信息;而且随着数据的增减或改变,也会对核心数据产生影响。如何从这些含有冗余的、不确定的、不完整的并且不断变化的海量数据中发现有用的知识信息,以帮助人们做出正确的判断和决策,是数据挖掘的一个重要研究领域。数据约简是在保持原有数据分类能力不变的前提下,将数据集中不重要的、不相关的冗余信息剔除掉。基于粗糙集理论的属性约简是近年来倍受研究者关注的数据约简研究之一。粗糙集理论由波兰数学家Z.Pawlak教授于1982年提出。该理论基于集合论思想,是处理不确定和模糊数据的有力数学工具。经典粗糙集仅适用于处理符号型数据,不能有效处理连续型数据。邻域粗糙集实现了对连续和混合型数据的有效处理,避免了对数据进行离散化而可能发生的重要或隐含信息的丢失。因此,基于邻域粗糙集的属性约简算法就成为属性约简研究的新热点。论文以邻域粗糙集为基础,研究了以下几种属性约简算法:首先,对基于邻域粗糙集的属性约简算法进行改进,以邻域粗糙集所确定的正域来评价各个属性的重要性,按重要性从大到小依次将属性加入约简集合,形成了多个属性子集,以支持向量机的分类性能评价各属性子集,从而选出分类准确率最高的属性子集作为约简结果。提高了约简集合的分类预测准确性。仿真实验表明了该方法的可行性与有效性。其次,针对连续型数据集不断更新变化的特点,提出了基于邻域粗糙集的属性约简增量式更新方法。根据新增样本对全集正域的影响,分情况对原约简集合进行不同的更新处理,有效避免了重复运算,降低算法复杂度。通过实例对算法进行了分析说明。最后,针对不完整决策系统的约简算法具有较高时间复杂度问题,在原有约简算法基础上,提出了基于邻域粗糙集的不完整决策系统前向顺序属性约简算法。该算法不仅适用于符号型的不完整决策系统,也适用于不完整的实型和混合型数据集属性约简;在保持系统分类能力的情况下,降低了不完整决策系统属性约简算法的时间复杂度;并且选择出属性个数更少的属性子集;提高了不完整决策系统的属性约简效率。通过实验表明了该算法的可行性与有效性。
其他文献
<正>对鲁迅稍有了解的人,读本文,凭语感马上想到,此题此文,本应写成《妈妈与"四书五经"》。为何?鲁迅的年代,按正经传统,本应写血缘之母,而不应写"非血缘"的保姆;按中国传统,
煤层气是指赋存在煤层中的以甲烷为主要成分的可燃有机气体,在煤化作用过程中,由于成煤物质和成煤环境的不同,各煤层的煤岩显微组分有较大差异,而煤岩显微组分对于煤体结构和吸附性具有较大影响。因此,为提高煤岩显微组分对煤层气吸附影响的认识,从而为有利区预测和煤层气开采提供理论指导。本文以韩城矿区不同煤岩显微组分(富镜质组、富惰质组)煤样为研究对象,收集韩城矿区基础地质资料,同时结合基础实验测试结果和计算机
针对平原区县级地名密度演变、重心时空演变及语义演变特征问题,该文以东北平原、华北平原、长江中下游平原为例,利用GIS、核密度估计方法对其进行直观地展示与分析。结果表明:
近年来,随着国家改革开放的发展,人民生活水平的提高,人民需求由物质生活上升到精神文化生活方面。国家为满足人民日益增长的精神文化需求,将现有高等教育资源与社会资本相结
贵州梵净山因在自然美学、生态过程与生物多样性方面具有全球性的突出普遍价值,于2015年列入世界自然遗产预备名录,并成为2018年中国的世界自然遗产申报项目。梵净山冷杉Abie
公民道德观是人生价值观的重要组成部分,对社会和个人的长远而持久的发展有着重要的作用。但近年来社会上出现了许多道德滑坡的现象,社会风气也受到了一定程度的影响。随着国
党十八大提出要从国家、社会、公民三个层面建立社会主义核心价值观,其中公民道德规范方面提倡爱国、敬业、诚信、友善的行为规范。诚信作为社会主义核心价值观的主要内容,既
青年大学生是中国特色社会主义事业的合格建设者和可靠接班人,他们的世界观、人生观、价值观正处于形成时期,容易受到社会环境等诸多因素的影响。随着我国社会的转型和现代信
<正>谈判的原则是什么?1、谈判的目的是共赢。2、谈判最不该做的事情是:接受对方的第一次出价。3、出价方需要报出有谈判空间的价格。4、关于补救的谈判,不争论对错,只争论如
王安石是北宋著名的文学家、政治家、思想家。他在诗、词、文三个方面都成就卓著,历代不乏论者。但是王安石在政治方面的成就更引人注目,由此掩盖了他的文学成就,以至于到现