论文部分内容阅读
本文研究的内容集中在Rough集理论,以及Rough集理论中的粒度计算理论在数据挖掘领域中的若干应用。Rough集理论是一种处理不确定性知识的数学工具,围绕着数据挖掘领域中的问题,本文利用Rough集理论与粒度计算理论,提出了若干解决方案。本文对数据挖掘及Rough集理论进行了基本概述,完成的主要工作包括:
1.针对以往的基于Rough集理论发现知识方法的绝对化,以及推出的规则过于肯定或过于否定,提出了基于可信度函数的知识量化方法。
2.知识约简是在决策表上进行的,而决策表一致与否在约简之前要加以判断并进行区分。本文提出了基于条件概率的对非一致决策表的划分,在将属性分为条件属性和决策属性的基础上,把每个个体的条件属性作为条件,决策属性作为在该条件下要发生的事件,然后通过对概率的值来判断该个体是属于一致决策表的,还是非一致决策表的。这种方法避免了以往对非一致决策表划分时要进行等价类的划分,结合交运算以及求其正域,因此起到了简化的作用。
3.提出了基于二进制粒度计算的量化方法。首先,按照决策属性值对决策表进行重新整理,决策值相同的个体放在一起;建立一个二进制表;根据决策表推出规则,再由给出的可信度值计算所需求满足的个体的个数;然后按照规则所给出的属性值上的二进制数进行AND运算,通过判断“1”出现的个数来进行判断该规则的准确性。
4.在建立了粒与二进制数的对应关系的基础上,定义了粒度包含和粒度基数,并给出了相应的属性值约简算法。该方法通过二进制数的AND运算及粒度包含来判断哪个个体的哪个属性可被约去,不仅速度快,而且效率高,还有利于在计算机上实现。
最后,对全文进行了概括性总结,并指出了有待进一步研究和完善的问题。