论文部分内容阅读
当今数据库的容量已经达到上万亿字节的水平.在这些大量数据的背后隐藏了很多具有决策意义的信息,怎么得到这些"知识"呢?为了应对这种海量的信息,人们提出了智能信息处理,希望计算机能自动从数据中获取其潜在的模型.Rough集(Rough Sets,也称粗集或粗糙集)理论是一种研究不完整、不确定性信息和数据表达、学习、归纳的理论方法.同时,Rough集理论也是粒度计算理论的重要内容.泛系理论侧重从广义的系统、关系、对称、转化、生克来研究一般事物机理.本文从Rough集理论和粒度计算理论出发,以泛系理论为指导,从理论和算法两个方面对Rough集理论和粒度计算理论进行了初步的探索.该文首先给出了Rough集理论的一些基本概念,并对概念进行了简要说明.第三章至第六章是该文主要贡献,总结如下:(1)第三章从泛系异同观的角度探讨了决策表的属性约简,并给出了一般性的结论.在讨论决策表属性约简的同时,对属性约简算法进行了改进,使得算法可以在属性约简时就找到决策规则条数较少的约简,从而简化了知识的表达.(2)第四章用泛系复合、泛权等概念重新表示了Rough集理论的一些基本概念,并且给出了用泛系复合来表示的协调决策表属性约简算法.在引入了泛系复合运算之后可以不通过集合之间的包含关系来确定规则的协调性.同时,在进行属性约简的时候不用计算下近似而确定某属性是否可约简.(3)第五章将泛系算子与Rough集的粒度推广模型相结合,使得Rough集的方法可以推广到一般的二元关系上,从而扩大了Rough集理论的应用范围.加上Rough集的粒度推广模型本身所具有的代数结构,因而可以在一般关系上形成具有"层次"的代数结构.(4)第六章从粒度计算理论和泛系异同观的角度出发,提出了一种新的决策表约简算法.该算法首先要用核属性确定一个对论域划分的粒度,如果粒度不够"细"(辨异同的能力不够强),再在粒度需要更"细"的部分采用更"细"的粒度,而在粒度已经足够的部分保持粒度不变.一方面,属性添加的原则是不够"细"则添加,这就保证了添加的属性不会是冗余的:另一方面,每一步的属性添加是在决策表的子表上完成的,这就保证了约简的效率能比较高.