论文部分内容阅读
在数据分析中,模糊粗糙集理论为处理不确定性提供了一种强大的数学工具。近年来,该理论引起了粒计算、机器学习和不确定性推理的广泛关注,然而经典的模糊粗糙集模型对数据噪声敏感的缺陷使得该理论在实际应用中受到了严重的限制。至今设计稳健的模糊粗糙集模型仍然是一个研究热点。本文分别从数据噪声的两类处理方式出发设计稳健的模糊粗糙集模型,具体的研究工作如下:分析了现有的粗糙集模型的稳健性及局限性。为了揭示粗糙集理论对数据噪声的敏感性,本文分析了Pawlak粗糙集、邻域粗糙集、模糊粗糙集、变精度粗糙集、邻域一致度、??-精度模糊粗糙集、模糊变精度粗糙集、变精度模糊粗糙集和模糊量化粗糙集的稳健性及局限性,并用实验对理论分析结果进行了验证。研究了一种基于软最小超球的模糊粗糙集模型。软最小超球问题是新颖检测的常用方法,本文将这个问题与模糊粗糙集模型结合建立了一种稳健模糊粗糙集模型,分析模型的性质,并用实验验证该模型的稳健性。本文利用基于软最小超球的模糊粗糙集模型的稳健性设计了一个稳健的模糊粗糙策树模型,并用实验对该模型的稳健性进行验证。研究了一种基于稳健统计量的模糊粗糙集模型。经典的模糊粗糙集是建立在最小值和最大值的基础之上的,这是导致该模型不稳健的直接原因。本文将稳健统计量的概念与模糊粗糙集结合设计了一种稳健的模糊粗糙集模型。该模型改进了经典模糊粗糙集模型上、下近似隶属度的计算方式,使得即使数据噪声存在隶属度的值也不会产生明显偏差。此外,本文用基于稳健统计量的模糊粗糙集模型的下近似设计了一个稳健的分类模型,并用实验验证了分类模型的稳健性。研究了一种稳健的模糊粗糙集模型――软模糊粗糙集。该模型是在软间隔支持向量机的启示下提出的,它将上、下近似隶属度与被忽略的样本数紧密地结合在一起,在增加样本的下近似隶属度或减小样本的上近似隶属度的同时限制了被忽略的样本数。为了验证软模糊粗糙集模型的有效性和稳健性,本文以软模糊粗糙集模型的依赖度函数作为特征评价指标设计了一个特征选择算法,并用数据集在选择的特征子集上的分类精度作为评价验证算法和软模糊粗糙集模型的稳健性。从抗噪方式和参数设置方式两方面将稳健模糊粗糙集模型进行了对比分析,并将这些模型应用于太阳耀斑预报中。本文以稳健模糊粗糙集的下近似隶属度作为案例选择和案例推理的理论依据,设计了一个基于案例的太阳耀斑预报模型,对预报模型的有效性进行了实验验证。