论文部分内容阅读
粗糙集(Rough Set,RS)理论,是继概率论、模糊集理论、证据理论之后的又一种新的处理不确定性信息的数学方法,能有效地分析和处理不精确、不完整、不一致等各种不完备数据,并从中发现隐含的知识,揭示潜在的规律。由于粗糙集理论对不确定问题研究的良好表现,使得它广泛应用于机器学习、知识获取、决策分析、数据挖掘、专家系统、决策支持系统、归纳推理、矛盾归结、模式识别等领域。我们知道,来自于不一致决策表的决策规则存在着不确定性,分类未知对象可能表现出多个不同地含义,使得人们无法确切地获得未知对象所代表的知识。然而,由于数据采集的定义、规范以及操作等方面的原因,所得到的决策表常常是不一致的。所以,如何消除或尽量降低不一致决策表的负面影响,成为信息系统知识发现和数据挖掘中的重要研究课题。本文以粗糙集理论为基础,提出组合频率约简及动态约简对不一致决策表分类的方法,并建立了测试系统对其有效性进行了验证。首先,频率约简利用统计理论与近似技术,能够最大限度的消除和压制不一致决策表的噪音和负面影响,对其中所蕴含的知识信息进行充分保留和挖掘。其次,动态约简利用其随机采样特性所带来的稳定性,能够克服标准粗糙集理论所计算的约简分类未知对象的不稳定的。因此,充分结合频率约简与动态约简两方面的优良特性,从而提高不一致决策表的分类质量和稳定性。