基于粗糙集的数据挖掘算法研究

被引量 : 28次 | 上传用户：hongtu200909

【摘要】

：

粗糙集理论是一种处理模糊和不确定性知识的新型数学工具,已经在机器学习、知识获取、决策分析、知识发现、专家系统和模式识别等领域取得了一些成功的应用,它与概率方法、模

【作者】

：

刘文军

【发表日期】

：

2004年01期

【关键词】

：

粗糙集数据挖掘完备化离散化置信度属性约简属性核可辨识矩阵广义信息表决策树广义决策集粗模糊理想 Lukasiewicz三值代数

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

粗糙集理论是一种处理模糊和不确定性知识的新型数学工具,已经在机器学习、知识获取、决策分析、知识发现、专家系统和模式识别等领域取得了一些成功的应用,它与概率方法、模糊集方法和证据理论方法等其他处理不确定性问题理论的最显著的区别是:它无需提供问题所需处理的数据集合之外的任何先验信息。本文以粗糙集理论为工具,对从数据库中得出潜在的、有用的知识的过程进行了详细的研究,其中包括数据的预处理、决策表的属性约简、决策表的决策算法及决策表中样本的分类算法等内容。全文主要分以下四个部分: 第一部分:详细研究了数据挖掘的过程,该部分包括四章(3-6章)。第三章首先简要介绍了现有的数据补齐方法及分析了这些算法中存在的问题,然后针对这些问题结合不同的属性类型,分别给出了有效的补齐方法。第四章主要研究了连续属性的离散化算法,首先详细介绍了基于熵的离散化算法(EBD)并对存在的问题进行了分析,然后根据数据挖掘中聚类的基本思想,对该算法进行了改进,给出了一种新的离散化方法。同时,本章中给出了一种划分关于另一种划分的置信度的定义,根据置信度的性质,提出了一种基于置信度的连续属性离散化方法。此两种方法最大的优点是能自动调节阈值,从而解决了离散化过程中阈值的难确定问题,而且离散化结果能保证决策表的相容性。第五章主要研究了决策表的属性约简算法,首先针对基于可辨识矩阵和逻辑运算相结合的属性约简算法中存在的问题进行了分析,然后给出了一种改进的约简算法,最后将该算法中的可辨识矩阵与文[21]中的可辨识矩阵进行了比较,得出本文定义的可辨识矩阵在计算量上远远少于文[21]中定义的可辨识矩阵。另外,本章还给出了一种求决策表最小属性约简算法—基于广义信息表求最小属性约简算法。该算法的关键是构造广义信息表,根据广义信息表的特点,决策表的属性核及约简可以由广义信息表中得出,该算法操作简单,计算效率高,便于计算机编程实现。第六章是关于求决策表的最小决策算法问题,首先结合属性约简算法的思想,给出了几种规则约简算法,然后得出最小决策算法,并对本文所给出的决策树与ID3决策树进行了比较,经过比较可知,在相容决策表的情况下,本文中构造的决策树不仅较简单,而且该树中的所有属性集一定是一个约简,但用信息增益得到的决策树不一定有这个性质。第二部分即第七章:讨论了连续值域决策表与不完备决策表的直接挖掘过程,也就是把粗糙集的理论方法扩充到连续值域决策表与不完备决策表,对于连续值域决策表及不完备决策表,直接建立知识分类与知识发现方法,这样发现的知识更符合实际。第三部分即第八章:对未知样本的分类算法进行了研究,首先对朴素贝叶斯分类算法中存在的不足进行了讨论,然后根据最大相似度原则,给出了一种基于相似度的

其他文献

粗集料对混凝土抗折强度影响的研究

混凝土是一种由硬化水泥石和集料构成的两相复合材料,混凝土中集料约占混凝土体积的60%～75%,集料对新拌及硬化混凝土的性能、配合比与经济性有显著的影响。但以往的研究大多集

学位

粗集料匹配关系抗折强度基体相分散相

基于TOPSwitch-GX系列的伺服系统多输出开关电源

用TOPSwitch-GX系列单片开关电源中的TOP244Y型电路设计了一种用于交流永磁同步电动机伺服系统的高交叉调整率的单端反激式多输出辅助开关电源。文中介绍TOPSwitch-GX的工作

期刊

开关电源TOPSwitch-GX反激式交叉调整高频变压器

中药调配信息化管理

中药调配是一项非常琐碎、复杂而又十分细致的工作,中药药品品种繁多,数量庞大、进货厂商的不同,一般不允许出错[1].但是每天大量的审方、计价、调配、复核、包装、发药等程

期刊

中药调配信息化管理

对ECC算法实现的选择明文攻击方法

提出了一种新型的基于构造输入点y坐标的CSPA方法,使得ECC密码算法中标量乘的点加和点倍运算产生明显的能量消耗差别,从而获取密钥信息。对多种ECC密码算法不同实现的芯片的

期刊

ECC算法标量乘法选择明文攻击侧信道分析

行为矫正视角下的惩罚教育

在教育过程中,奖励和惩罚是两种基本而必要的手段。但在全面推行素质教育的形式下,惩罚教育似乎成了上不了台面的教育手段,得不到社会的认可,导致这种情况主要原因是对惩罚的

期刊

惩罚矫枉过正罚时出局反应代价

完善企业内部控制的探讨

内部控制是随着企业对内加强管理和对外满足社会需要而逐渐产生并发展起来的自我检查、自我调整和自我制约的系统,是社会发展的必然产物。内部控制可以合理保证单位有效进行

学位

内部控制控制环境公司治理

跨过“虎溪”——从明宪宗《一团和气图》看中国宗教艺术的跨文化整合

<正>2008年7月底,我在首都博物馆举办的大型展览"中国记忆:五千年文明瑰宝展"上看到了一幅中国国家博物馆的绘画藏品:明代成化二十一年(1485)宫廷画家绘制的长卷《宪宗元宵行

会议

TiO2纳米晶和薄膜的制备、表征及薄膜光电性质研究

TiO2是一种重要的无机功能材料,具有独特的物理和化学性能,近年来引起了人们的广泛关注。锐钛矿相本征TiO2的禁带宽度为3.2eV,其对波长小于387.5nm的紫外光就有较强的吸收,是

学位

TiO2锐钛矿相光电转换光电流

老年肺结核患者的临床分析及其护理对策研究

目的分析老年肺结核患者的临床特点,探讨其护理对策。方法对2003～2007年收治的360例老年肺结核患者进行回顾性分析。结果老年肺结核传染性大、病程长、并发症多且心理状况差。

期刊

老年肺结核护理

微波活性炭组合技术处理难降解废水的应用研究

本文主要进行了在不同催化剂存在条件下微波辐射处理甲基橙和活性艳蓝X-BR染料溶液及城市污水厂尾水研究。首先对微波辐射协同活性炭氧化甲基橙溶液进行了研究。考察了甲

学位

微波辐射活性炭甲基橙活性艳蓝X-BR城市污水厂尾水氧化

基于粗糙集的数据挖掘算法研究

与本文相关的学术论文