论文部分内容阅读
粒度计算是信息处理的一种新的概念和计算范式,覆盖了所有有关粒度的理论、方法、技术和工具的研究,它是词计算理论、粗糙集理论、商空间理论、区间计算等的超集,也是软计算的一个重要分支,它已成为模糊的、不完备的、不精确的及海量的信息处理的重要工具和人工智能领域研究的热点之一。自波兰学者Pawlak于1982年提出了粗糙集理论以来,由于粗糙集理论具有很强的定性分析能力,能够有效地表达不确定的或不精确的知识,善于从数据中获取知识,并能利用不确定、不完整的经验知识进行推理等,因此在知识获取、机器学习、规则生成、决策分析、智能控制等领域获得了广泛应用,特别是在数据挖掘领域获得了巨大成功,业已成为粒度计算研究领域的主要方向之一。
本文跟踪国际学术前沿,在粗糙集和粒度计算理论框架下,对不确定信息处理及其度量理论与知识约简方法进行了深入的研究。为了度量信息系统中属性重要性,本文从知识粗糙性的粒度原理和经典的知识粒度及信息熵理论出发,对经典的知识粒度及信息熵理论进行推广,给出了信息系统中知识的粒度和粒度熵原理,揭示了知识粒度和粒度熵原理的本质和关系,为进一步研究知识的粒度计算提供了理论基础;为了度量信息系统中属性相关性,本文借鉴集合论中对称差的概念,从粒度计算的观点出发,给出了信息系统中知识距离的概念,分析了其相关性质,并指出利用知识距离也可以度量属性的相关性,同时又给出了知识贴近度的概念,并分析了它与知识距离的关系;针对信息系统中的知识约简,本文分别提出了一种基于知识粒度的属性约简算法和一种基于知识距离的属性约简算法,这些算法针对现有知识约简算法[68-70]中存在的不完备性问题做了改进,且这两个算法都不需求核,对无核的这种特殊信息系统计算约简更加有效,同时它们的算法时间复杂度也分别较文献[68]和文献[69,70]中的算法时间复杂度有所降低。