论文部分内容阅读
粗糙集属性约简通常反映的是信息表的本质信息,它是粗糙集理论的核心内容。通常情况下,信息系统的约简是不唯一的,人们希望找到一个包含最少属性的约简,即最小约简。因此,研究更为有效的属性约简算法,有效地获取最优特征子集,降低算法的时间复杂度,提高寻优的准确性,仍然是粗糙集属性约简理论的主要研究方向。通过对现有算法的研究与分析,本文提出了一种同时适用于完备和不完备信息系统的属性约简的方法。同时,对如何将属性约简方法应用于中医诊疗症状提取进行了研究。本文的主要工作包括以下几个方面:首先,简要介绍了粗糙集理论的基本知识,包括信息表达系统,上近似和下近似,属性约简与核,属性依赖度和重要度等概念以及不完备信息系统下的相容关系。其次,对属性约简算法进行了详细的研究与分析。着重对完备的和不完备信息系统下的属性约简算法进行了总结对比,以发现各种算法存在的优势和不足。再次,在分析现有属性约简算法所具有的优势和存在不足的基础上,本文提出了一种基于属性作用集差异度的属性约简算法。所提出的算法既适用于完备系统,也适用于不完备信息系统。在算法的设计中,将基于容差关系和等价关系的论域划分方法进行融合,对属性作用集的概念给出定义,并且以决策表中条件属性作用集和决策属性作用集之间的差异度为核心,重新定义了一种属性重要度,用启发式的方法同时在完备和不完备信息系统下寻找约简子集。此外,将粗糙集理论的近似分类质量应用于约简子集的评价中;最后通过测试与比较实验结果表明,所提出的方法可行的,并且在有核的数据集上能快速准确地找到约简子集。另外,本文还研究了属性约简在中医诊疗症状提取中的应用。详细阐述了中医诊疗原始数据到可用决策表的处理过程,并且用本文提出的算法在乙肝后肝硬化药物疗效决策表中提取到了与专家诊断相吻合的症状,从而发现了属性约简在中医诊疗中的研究意义,为中医证候研究提供了理论依据。最后,对论文的研究工作进行了总结,并提出了下一步的工作展望。