论文部分内容阅读
粗糙集理论和方法是一种能有效的分析和处理不一致、不精确、不完备等各种信息的数据分析工具。该理论和方法已经在模式识别、机器学习、决策支持、知识发现、预测建模等领域得到成功的应用。相对属性约简算法和决策方法是粗糙集理论和应用的关键技术之一,也是知识发现和决策的重要研究课题,并已成为一个备受关注的研究热点。围绕粗糙集相对属性约简和决策方法中的相对属性约简、决策规则获取、基于粗糙集的决策方法以及其原型系统等四个重要问题,从六个方面开展研究工作。它们分别是基于贪心策略的相对属性约简、基于核的自顶向下剪枝的相对属性约简、基于贪心策略的分类规则获取、基于粗糙集的支持向量决策方法、基于粗糙集的最优支持向量决策方法和基于粗糙集的支持向量集成决策模型。针对寻求单个相对属性约简的问题,基于贪心策略的相对属性约简算法以条件属性的分类能力作为启发信息,是解决相对属性约简的一种有效算法,该算法的实现比较直观。当决策信息系统中包含有大量对象时,该算法有效节约了存储空间,适合大规模数据集上的计算,而且在该相对属性约简方法中,仅仅考虑了属性分类能力大小,倾向于选择分类能力强的条件属性加入到相对属性约简中,根据分类目标,这种倾向是合理的。当一个决策信息系统包含相当多的属性和大量的纪录时,如何从决策信息系统中获取包含最少条件属性的相对属性约简和获取所有相对属性约简的集合是一个值得研究的课题。基于核的自顶向下剪枝的相对属性约简算法是解决该问题的一种可行算法,实验结果表明基于核的自顶向下剪枝的相对属性约简算法的可行性和有效性。在决策规则的获取方面,根据决策规则的不同度量,从不同的角度获取决策规则,可获得基于贪心策略的分类一致性规则获取算法和不一致性分类规则获取算法。这些算法根据属性的决策能力的大小作为启发式知识来指导这一属性值约简过程的进行,不但获取的规则通常较短,而且有较强的分类预测性能,既提高了运行速度,又节约了存储空间。随着决策信息系统的数据量的增加,粗糙理论分类的容错能力与泛化能力较弱等缺点也突现出来,因此,如何提高决策信息系统的容错能力与泛化能力是一个值得研究的课题。从不同的角度,可获得基于粗糙集和支持向量优点的三种决策方法。通过对比实验,结果表明相关算法有较高的容错能力与泛化能力。基于前面的研究结果以及有关技术,设计并实现了一个基于粗糙集的相对属性约简算法和决策方法的原型系统。与同类系统相比,该系统在设计实现上具有一定的独到之处,具有较高质量的知识发现和决策结果,并具有较好的容错能力与泛化能力,还具有较强的鲁棒性。