论文部分内容阅读
从数据中发现有用的知识并做出合理的决策是数据分析研究热点之一。三支决策作为一种符合人类认知的决策模型被广泛的应用于数据分类和规则获取,它取代了传统的“非黑即白”的二支决策,允许第三种中间决策:延迟决策,这使得决策更具灵活性和可靠性。在现实的数据分析过程中,由于某些原因,数据可能会不完整,数据丢失或者部分已知,也有一些数据本身是不存在的,这样的数据在信息系统中称之为不完备信息,具有不完备信息的信息系统称之为不完备信息系统。不完备信息系统的相关主题已被广泛地研究,但是,对不完备信息的各种不同类型的语义却没有一个普遍的共识。由于缺乏语义的解释,导致很难去研究不完备信息系统的决策问题。本文通过总结不完备信息的常见语义,将完备信息系统中基于概念计算和概念认知获取三支决策的方法推广到不完备信息系统中,并讨论了当不关心空值型不完备信息系统动态变化时,近似度的增量式更新。主要获取了以下的研究成果:(1)基于经典集从概念计算和概念认知两个方面研究不完备信息系统的三支决策。基于经典集概念计算方法的核心是研究对象之间的相似关系和相似类,通过两种方法来研究对象的相似性:一种是基于不完备信息的语义直接在不完备信息系统中研究对象之间的相似关系,从而得到对象的相似类;另一种是基于可能值语义将不完备信息系统转化为集值信息系统来讨论对象之间的相似性。基于集值信息系统从两个角度出发讨论对象的相似性:第一种是基于对象的集值之间的关系得到对象之间的相似关系,从而得到相似类;另一种是将集值信息系统完备化为一族完备的信息系统,研究完备化信息系统中对象之间的等价关系,从而得到对象之间的相似关系,并进一步得到相似类。基于经典集概念认知方法的核心是研究对象对于描述公式的可满足性,通过不完备信息的不同语义定义了不完备信息系统中对象的描述,满足对象描述公式的对象集构成了该对象的相似类。不完备信息系统中对象的相似类就是可定义集,基于相似类的描述,进一步获取三支决策规则。(2)基于模糊集从概念计算和概念认知两个方面研究不完备信息系统的三支决策。首先通过可能值语义将不完备信息系统转化为集值信息系统。基于模糊集概念计算方法的关键是研究对象之间的相似度,通过推广了完备信息系统中的等价关系,提出了一种新的对象之间相似度的定义。基于此,分别使用α-相似类或对象的近似度来进一步获取三支决策规则。基于模糊集概念认知方法的关键是研究对象对于描述公式的满足度,通过推广完备信息系统中对象对于描述公式的可满足性,定义了不完备信息系统中对象对于描述公式的满足度。基于此,分别使用描述公式的α-意义集或公式的可信度来进一步获取三支决策规则。(3)针对不关心空值型不完备信息系统提出基于程度容差关系的三支决策模型,并研究不完备信息系统动态变化时近似度的增量更新。首先,在不关心空值型不完备信息系统中定义了可以刻画对象之间相似性程度差异的程度容差关系。然后通过模糊逻辑算子定义了对象的正、负近似度,并引入关系矩阵,用以有效的计算近似度。其次在对象的近似度中引入阈值,得到了对象的正、负描述域,并进一步获取三支决策规则。当不完备信息系统动态变化时,讨论了增量式更新对象近似度的方法来有效的获取变化后信息系统的决策规则。分别讨论了当不完备信息系统中删除或添加属性、删除或添加对象以及更改对象的属性值时,通过增量更新关系矩阵来更新近似度的不同增量算法。最后通过UCI中的数据集评估算法的效率。