论文部分内容阅读
模式分类算法是数据挖掘研究的一个热点和难点问题,相关算法在许多领域被广泛应用。由于在许多工程实践中,分类精度是评价算法性能的重要指标。所以,高性能的集成方法近年来受到研究人员的广泛关注,多分类器集成就是其中一种提高分类精度的有力武器。多分类器能提高精度的潜在原因之一在于:它能综合不同分类器的信息,避免单一分类器可能存在的片面性。那么,如何有效“融合”不同分类器的信息就成为其最为重要的关键技术。
本论文主要采用证据理论的方法对多决策树进行集成。证据理论已被证明在信息融合、目标识别、知识推理等领域有着广泛的应用前景。同时,它作为一种推理方法,在解决不确定性问题中具有显著的特点。本文所提方法的基本思路是:首先对决策树输出的信息进行不确定表征,即对输出证据的基本概率分配进行赋值;然后,利用证据组合规则对多决策树进行集成。
本文的主要研究工作概括如下。
首先,分析了数据挖掘、数据挖掘的分类器——决策树的基本理论和方法,并建立随机决策树和随机森林的模型,为研究基于多分类器融合的分类算法打下基础。
其次,对证据理论的相关内容进行了系统的研究,为研究多分类器的融合方法提供理论支持。
最后,研究多分类器融合理论,利用证据理论对多决策树输出的信息进行融合,建立基于证据理论的决策森林的模型,并在UCI标准数据集上进行仿真实验,结果表明此方法是有效的,它能有效提高分类器的精度和泛化能力。
本文的工作对于集成学习的研究具有一定的参考价值。