论文部分内容阅读
粗糙集理论(Rough Set Theory, RST)作为一种能够有效分析和处理不精确、不确定和不协调信息的数学理论是波兰数学家Pawlak教授于1982年提出来的。在Pawlak经典粗糙集的研究中,大多数是针对完备信息系统(Complete Information System, CIS)而言,然而在实际问题中由于各种原因通常都是不完备信息系统(Incomplete InformationSystem, IIS),所以,把粗糙集理论应用在不完备信息系统中一直是粗糙集理论研究的重要课题之一。但是Pawlak经典粗糙集和目前很多拓展的粗集模型都是建立在单个不可分辨的二元关系的基础上的,因此,我国学者钱宇华从粒计算的角度出发,分析了经典粗糙集中用单个不可分辨的二元关系的知识粒度近似表示未知概念的不足,从而提出了由多个二元关系导出的知识粒度的概念,给出了多粒度粗糙集模型。容差关系是为了处理不完备信息系统应用非常广泛的一种二元关系,本文首先分析了基于容差关系的拓展粗集模型,包括基于容差关系的可变精度粗糙集和基于容差关系的多粒度粗糙集。本文接着结合可变精度粗糙集和多粒度粗糙集的各自优点,在不完备信息系统中提出了基于容差关系的可变精度多粒度粗糙集模型,研究了基于容差关系的可变精度乐观多粒度和悲观多粒度粗糙集的一些性质,研究了基于容差关系的可变精度多粒度粗糙集与Pawlak经典的粗糙集之间的关系,进一步讨论了基于容差关系的可变精度多粒度粗糙集的约简问题,提出了一种基于属性重要度的启发式约简算法,并研究了决策规则获取的方法。本文最后将基于容差关系的可变精度多粒度粗糙集应用在电子商务网站的Web挖掘中,通过对某电子商务网站客户行为及数据研究分析,利用基于容差关系的多粒度粗糙集以及可变精度多粒度粗糙集的相关理论及其算法,通过约简并得到了电子商务网站客户行为的决策规则,实验的结果验证了该方法的正确性和可行性。