论文部分内容阅读
三支决策理论起初是为了解释粗糙集三个区域而提出。具体点说,粗糙集的正域、边界域和负域可以分别看成在一个三支决策中的接受区域、不承诺区域和拒绝区域。三支决策理论比传统二支决策多了一个不承诺选择。目前的三支决策理论的研究主要是基于粗糙集的三支决策理论,而其中最具有代表性的是决策粗糙集理论模型(Decision Theoretic Rough Set Model, DTRSM),由姚一豫等在1990年提出。二十几年来,DTRSM被引入到各个学科和领域,取得了很大的成效。目前,基于决策粗糙集的三支决策模型仍存在需要进一步完善的问题:一、在该模型中,三个域的形成由一对阈值α,β来决定,阈值α,β由损失函数计算得到,而损失函数由专家或者人的经验给定,具有很大的主观性;二、该模型只是将样本划分到三个域,并没有对边界域中的样本做进一步的处理。本文主要将构造性覆盖算法(Constructive Covering Algorithm, CCA)引入到三支决策中,提出了基于构造性覆盖算法的三支决策模型。该模型可以根据样本的分布特征自动形成三个域。相比于基于决策粗糙集的三支决策模型,基于构造性覆盖算法的三支决策模型不必人为决定关键参数,能自动形成三个域,使得如何获得DTRSM中损失函数λ、阈值α,β的取值问题得以解决。另外在基于该模型提出的基础上,对于划分到边界域中的样本,本文给出了两种处理方法:处理全部的边界域样本和处理部分边界域样本。本文的主要工作包括:1.本文介绍了三支决策理论的发展历程,详细的描述了现有三支决策模型的优缺点。对三支决策理论的研究现状进行了分析,并将构造性覆盖算法引入到三支决策中,提出了基于构造性覆盖算法的三支决策模型。该模型根据样本的分布特征自动形成三个域,不需要人为给定参数。我们介绍了该模型如何自动形成三个域,并给出了根据这三个域如何划分样本的方法。实验是在两类和多类样本的数据集上进行了对比实验。实验结果表明,与目前的基于决策粗糙集的三支决策模型相比,基于构造性覆盖算法的三支决策模型的分类正确率更高,效果更好。同时这也为三支决策理论提供了一个新的形成三个域的解决思路。2.在提出基于构造性覆盖算法的三支决策模型基础上,本文对于落入边界域中的样本,提出了两种决策方案,一种为处理全部的边界域样本方法,即处理边界域样本是按照某种原则进行划分。本文给出了距覆盖中心最近、距覆盖边界最近、万有引力三种原则。另一种为处理部分的边界域样本方法,即只对满足一定条件的边界域样本做进一步的划分,使不满足一定条件的边界域样本仍保留在边界域。这样做的目的是只处理相对容易被区分的样本,而那些相对难被区分的样本暂时不处理。这样提高了边界域样本处理的正确率。本文用十交叉法在五组数据集上对这两种决策方案做了对比。实验结果表明,处理部分边界域样本时正确率更高,效果更好。