论文部分内容阅读
随着云计算、大数据等新兴信息技术的广泛应用,各领域的数据急剧增长,这其中结构化数据仍然是数据的主要表现形式之一。在这些数据中往往含有大量冗余的与不确定性数据,从而导致模式分类的处理能力与决策的辨识能力的降低。区间值型数据与直觉模糊型数据作为信息的不确定与不充分的表现形式是两种重要的结构化数据。如何从这两类不确定数据中发现有价值的信息和规律为管理者提供决策参考,仍然是管理决策科学领域中的研究热点之一。粗糙集理论作为数据挖掘领域中的重要方法之一,其最显著的优点是在于不需要提供解决问题所需要的数据以外的先验知识,只要面向数据本身提供的信息,就可以实现对数据的分类与决策规则的获取等任务。该理论已经被成功地应用于机器学习、数据挖掘、决策分析等诸多领域。经典的粗糙集模型是建立在等价关系基础之上的,要求相对较为严格,处理不确定性数据存在着局限性。因此,经典粗糙集模型的各种扩充对于不确定信息系统的知识约简与决策规则的获取具有极其重要的意义。本文以粗糙集为工具,结合国内外的研究现状,较为系统的研究了单粒度与多粒度背景下区间值信息系统与直觉模糊信息系统的属性约简及其决策规则的获取问题,同时面向交通事故因素关联分析问题构造了一种群决策属性粗糙集模型并加以应用。本文的主要创新性工作如下:(1)分析了现有的容差关系在区间值聚类中的不足,本文构建了一种模糊等价关系,基于此关系分别从单粒度与多粒度视角建立了区间值信息系统的粗糙集模型,给出分辨矩阵、属性约简的判定定理及其属性约简的方法,基于模糊等价关系定义了区间值决策系统上的决策规则置信度因子,给出了决策规则的支持定理及其决策规则的获取方法。(2)分别从单粒度与多粒度角度建立了直觉模糊信息系统的粗糙集模型。定义了直觉模糊信息系统上的偏序关系及其分辨矩阵,给出了有效的属性约简方法。基于直觉模糊决策系统的分类质量给出了相对属性约简的计算方法,研究了相对属性重要度以及序决策规则的提取方法,建立了直觉模糊信息系统的乐观多粒度与悲观多粒度两种模型,分析了相应的性质及其与单粒度模型的联系与区别,给出了基于多粒度序关系的决策规则置信度因子及其决策规则的获取方法。(3)现有的粗糙集模型在处理不协调直觉模糊决策系统时会使下近似包含对象的个数很少,影响了确定性决策规则的获取。本文定义了直觉模糊决策系统的协调度并提出了一种变协调度粗糙集模型,通过调节协调水平的大小允许部分被遗漏的对象进入下近似集中,分析了该模型的相关性质,定义了协调水平下直觉模糊决策系统的分类质量并给出了相应的约简方法与最优决策规则获取方法。(4)以交通事故历史统计数据为背景,分析了现有的单决策属性粗糙集模型在处理交通事故成因分析中的局限性,本文构建了一种群决策属性粗糙集模型,分析了该模型的性质及其与单决策属性粗糙集模型的关系,基于该模型从隐患指标(条件属性)和事故指标(决策属性)对道路交通事故指标因素进行关联性分析并获取决策规则,为交通管理决策提供参考依据。