论文部分内容阅读
决策树学习是应用最广泛的归纳推理算法之一。决策树通过一个简洁的树型结构代表了原始数据的信息。一棵决策树中不具有预测能力的部分应该终止它的生长或对其修剪,如何精确地估计何时停止决策树的增长很困难,一般采取人为控制或专家领域知识、先验知识的控制,这大大降低了该方法的智能性,也限制了其应用的推广。而粗糙集理论能有效地分析和处理不精确、不一致、不完整等各种不完备信息,并从中发现隐含的知识,揭示潜在的规律。可以提高知识获取过程的自动化程度。近年来其有效性己在许多科学与工程领域的成功应用中得到证实。基于此,决策树学习方法引入粗糙集理论。本文主要研究内容和工作成果如下:1.系统阐述了决策树学习算法的工作原理和实现方法,比较了典型决策树算法之间的优缺点,介绍了决策树的评价标准。2.分析了基于粗糙集的决策树算法,并与经典的决策树算法做了实例比较,实例表明前者在保证分类精确度的同时也简化了决策树。提出了基于决策协调度的决策树自主式学习算法。该算法把粗糙集理论中的决策协调度作为分离属性的标准,用具有局部优化性质的条件确定度来控制树的增长。通过实例给出了树的生长过程,解决了决策树学习时需要人为指定阀值来进行剪枝的问题。3.针对现实数据是动态的基础上,初步研究了增量式知识获取问题。给出了决策树预剪枝的自主式增量学习算法。用实例验证了该算法的正确性,并对算法的复杂度进行了定量分析。该算法可以解决增量数据集构造决策树的问题,避免在处理增量数据集时,不断重构决策树的庞大费用。处理小增量数据具有良好的效果。最后针对目前的状况,讨论了本课题今后进一步的研究方向。