论文部分内容阅读
粗集理论作为一种新的软计算方法,通过把知识和分类密切地联系起来,为处理不确定、不完全数据的分类问题提供了符合人类认知的数学工具。基于粗集理论的知识发现技术已成为决策科学的研究热点。随着社会经济的发展和人们生活水平的提高,气象问题已经成为社会关注的热点问题之一。如何根据观测数据获得准确的灾害气象规律越来越为气象界关注。本文针对粗集理论应用中的几个关键问题进行了研究,并将结果应用到气象问题的分析中,取得了一定的效果。 首先,对基于粗集理论的数据离散化技术进行了比较分析,首次提出了基于遗传算法的离散化方法,有效克服了行列计算法中结果受字段位置和断点位置影响的不足,并将几种离散化算法及其组合进行了比较分析和组合运用。实验结果表明:基于遗传算法的离散法是一个相对较好的离散化方法,增类减类离散法与行列离散法是相对较佳的一对方法组合。 其次,实现了基于粗集理论的属性约简方法——基于可分辨矩阵的属性约简法和基于遗传算法的属性约简法,并通过降维、稀疏化、正例集和反例集的有效选取、新的选择算子等方法对原算法进行了改进。实验证明,新的算法都大大降低了算法时间复杂度,提高了算法效率。 再次,提出了一种基于可分辨矩阵的决策规则提取新方法。该方法通过对属性约简得到的中间结果和最终结果的有效利用,大大降低了算法的时间复杂度和空间复杂度,实验结果也充分证明了该算法的有效性。 最后,在对各种方法进行了认真分析和研究的基础上,研制了一种基于粗集理论的数据离散化和规则提取的软件平台,可以用于数据挖掘的前处理。系统应用于气象数据分析,取得了良好的效果。