论文部分内容阅读
分类是数据挖掘领域中最为重要的一类问题。许多数据挖掘问题本质上都可以等价地转化为分类问题。粗糙集理论和证据理论都是处理不确定问题的重要工具。证据理论用基本概率分配函数、信任函数、似真度函数处理不确定性问题,在分类挖掘中具有自身的优势。粗糙集理论处理不确定问题的优点在于不需要先验信息,在分类挖掘领域得到广泛应用。然而在许多实际分类问题中,对象之间往往构成覆盖关系,致使Pawlak粗糙集模型的应用受到限制,不能有效地对待识别样本分类,很多论文将Pawlak粗糙集模型拓展为覆盖粗糙集。为保留Pawlak粗糙集模型特有的优良性质,有必要对覆盖粗糙集模型进行合理有效的转化。由于粗糙集理论未能包含处理不精确或不确定的原始数据的机制,它与证据理论有很强的互补性,并能有效解决证据理论研究问题带来的一些问题。首先,论文介绍了证据理论与覆盖粗糙集分类的研究背景和意义,简述了证据理论研究现状、粗糙集理论研究现状、覆盖粗糙集的研究现状及证据理论与覆盖粗糙集之间关系的研究现状;接着介绍了Pawlak粗糙集理论和覆盖粗糙集理论、证据理论的相关知识。其次,论文通过对邻域覆盖以及覆盖导出的等价关系进行研究,提出了覆盖粗糙集的一种转化新方法,新方法证明了由一个覆盖可唯一导出一个划分,由一个覆盖与其覆盖约简导出的划分一致等结论,得出了由覆盖导出的等价关系的近似算子更加细分等优良性质,提高了集合的近似程度,然后通过实例进一步验证了论文提出的转化方法的优越性。再次,论文对各种Pignistic概率转换方法及证据理论的决策规则进行研究,提出了基于规划方法的相容概率决策规则,通过实验对比研究,进一步验证了该决策规则的有效性,将此相容概率决策规则用于样本的分类,更加直观、准确,有利于降低样本分类的误判率。最后,研究基于证据理论的覆盖广义决策规则及其分类方法。论文提出了基于证据理论与覆盖的三种分类方法,即方法1,方法2,方法3,以及基于证据理论与覆盖转化的四种方法,即方法a,方法b,方法c与方法d。通过实例对各种分类方法比较,得出由覆盖导出的等价关系的方法得到的分类误判率比直接用覆盖粗糙集得到的误判率更低等结论。