论文部分内容阅读
随着计算机通信技术以及互联网的快速发展,各领域内的信息量随着时间的推移快速增长,人类已经进入大数据时代。尽管人们被海量数据所包围,但却并没有与之相匹配的数据分析处理能力,依然面临着知识匮乏的局面,因此,知识获取近年来已成为研究热点。作为知识获取的一种手段,粗糙集理论处理不确定信息具有得天独厚的优势,但是当数据中出现噪音或信息缺失时,基于精确分类的粗糙集表现效果不佳,而粗糙集的改进模型变精度粗糙集则为此类问题提供了一个较好的解决途径。粒计算作为一种处理大规模、复杂问题的计算模型,通过信息粒子的形式表示或处理信息。其核心思想是将所求解问题转化为多个子问题,在各粒度空间内分别进行求解,最终将多个子问题的解进行合并,共同构成原始问题的解。粒计算从多粒度方向分析求解问题,不仅降低了求解原始问题的难度,而且满足了人类希望从多角度分析问题的要求。部分研究者将粒计算中的多粒度思想与粗糙集理论相结合,提出了多粒度粗糙集,为解决从海量数据中进行知识获取提供了一个有力工具。本文在变精度粗糙集和多粒度粗糙集理论的研究基础上,重点研究了信息系统的属性约简及规则提取,主要从以下几个方面进行研究:1.将粒计算理论中粒化思想运用到条件等价类、决策等价类的粒化过程中;将条件信息粒、决策信息粒用粒矩阵进行表示,并基于变精度粗糙集理论提出一种β粒关系矩阵,该矩阵从本质上反映了条件信息粒及决策信息粒之间的概率包含关系,这种概率包含关系是进行属性约简及规则获取的理论基础。2.在属性约简的研究中,首先提出了基于变精度正域的多粒度属性约简算法,随后分析了该算法的不足,提出了改进的基于变精度下近似的多粒度属性约简算法。3.对于决策信息系统的规则提取,首先利用矩阵运算,在不同粒度空间内进行求解,并通过定义启发式信息,对各粒度空间进行排序,以减少搜索空间。然后,提出了一种基于变精度粗糙集的完备决策表多粒度规则获取算法,该算法适用于一致决策表及不一致决策表,提高了算法的泛化性。最后在此基础上提出了基于变精度粗糙集的不完备决策表多粒度规则获取算法,分别对所提两种算法进行实例分析以及UCI数据集测试,测试结果表明算法的正确性与有效性。4.在本文提出算法的基础上设计了基于变精度粗糙集的多粒度知识获取系统平台,该平台集成了本文所提算法以及一些传统算法,方便用户选择合适的算法进行知识获取。