基于粗糙集理论的数据挖掘模型及属性约简算法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:FSM0225
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘与知识发现研究如何从大量的数据中智能地、自动地提取出有价值的知识和信息,是目前相当活跃的研究领域。知识发现定义为从数据集中识别出有效的、新颖的、潜在有用的,以及最终可理解的模式的高级(非平凡)过程。数据挖掘是知识发现过程中的核心步骤。粗糙集理论是波兰数学家Z.Pawlak在1982年提出的一种分析不完整、不确定数据的数学工具,目前被广泛应用于数据挖掘与知识发现研究。研究基于粗糙集理论的数据挖掘具有极大的理论意义和现实意义。 论文首先概述了数据挖掘的标准数学模型以及基于粗糙集理论的数据挖掘模型,针对传统的基于粗糙集理论的数据挖掘模型存在着不实用的特点,在此基础上,通过查阅各种资料文献提出了一种改进的基于粗糙集理论的数据挖掘模型。接下来,论文对粗糙集理论的属性约简算法进行了比较深入的研究并归纳总结了目前的一些主要约简算法。属性约简算法是基于粗糙集理论的数据挖掘模型中的关键步骤,同时也是粗糙集理论研究中的一个研究重点。到目前为止,在属性约简算法方面已经有了一些成果,然而还没有一个公认的、高效的约简算法。通过研究现有的一些约简算法,论文提出了一种基于属性频率的改进约简算法。该算法是一种启发式算法,建立在可辨识矩阵计算基础上。改进算法基于Hu的算法与Jelonek算法,在计算可辨识矩阵的基础上,保证最终能够找到决策信息系统的一个约简,同时较Jelonek算法相比,运算时间明显减少。 基于粗糙集理论的数据挖掘研究正处于起步阶段,数据挖掘本身及粗糙集理论研究还有许多问题值得探讨,论文将二者结合研究肯定还有许多不完善的地方,相关工作还有待进一步研究。
其他文献
JPEG2000是新一代图像压缩标准,JPEG2000与传统JPEG最大的不同,在于它放弃了JPEG所采用的以离散余弦变换(Discrete Cosine Transform)为主的区块编码方式,而采用以小波转换(W
稻属C染色体组物种是组成药用野生稻复合体的主体,是稻属的关键类群,也是栽培稻品质改良的重要基因库。C染色体组二倍体物种还是构成异源四倍体物种(BBCC,CCDD)的重要亲本。与此
空时分组编码是将编码、调制和发射分集技术结合起来的一种新兴技术,它是改善无线通信性能、提高带限系统数据速率的一种理想的选择。 本文基于Tarokh、Alamouti和Jafakhan
本文主要针对超深亚微米PMOSFET中的NBTI效应进行了深入研究,首先通过实验分析了NBTI退化行为及其器件和电路寿命的影响;给出了NBTI效应中退化反应的模型和反应动力学,并从反
白刺、沙棘和枸杞是青海特色浆果类植物,白刺种子的含油量大于10%,沙棘、枸杞种子的含油量分别为16%~18%、18%。果汁是浆果鲜果中最有价值的成分,把果汁制作成果粉,便于运输、
土地利用/覆盖变化(LandUse/CoverChange,简称LUCC)是全球变化的重要驱动因素,已成为全球变化研究的热点问题。西南喀斯特地区不断恶化的生态环境引起了学术界的关注,无疑应
学位
图像分割是计算机视觉领域中的一个极为重要的基本问题,其应用范围非常广泛,几乎出现在有关图像处理的所有领域,并涉及各种类型的图像.其中,动态轮廓线算法是一种比较新颖的
随着现代无线通信技术的飞速发展,具有剖面低、重量轻等特点的微带天线应用越来越广泛.本文研究近来新发展的电磁带隙结构在微带天线中的应用.文中对电磁带隙结构作了介绍和
膀胱癌是一种在泌尿系统中常见的恶性肿瘤,其发病率近年有上升趋势;在我国,膀胱癌是泌尿系统中发病率和危害性最大的肿瘤。一般认为,膀胱癌的早期诊断和发现对于提高患者的生存
本文通过对荣华二采区10