论文部分内容阅读
集成学习是一种新的机器学习范式,它使用多个学习器来解决同一个问题,能够显著地提高学习系统的泛化能力,因此从20世纪90年代开始,对集成学习的理论和算法的研究成为了机器学习领域的一个热点。现在,集成学习已经成功应用于行星探测、地震波分析、Web信息过滤、生物特征识别、计算机辅助医疗诊断等众多领域。 然而集成学习技术还不成熟,集成学习的研究还存在着大量未解决的问题。从集成学习的实际应用情况来看,也远未达到人们所期待的水平。 本文对集成学习进行了深入地研究,简要介绍了集成学习的概念、构成和作用,分析了集成学习中两大算法族Boosting和Bagging的理论基础,阐述了选择性集成学习的基本思想,讨论了目前集成学习存在的不足,利用群体智能,结合云模型理论,提出相应的解决办法,完成了以下研究工作: 1、针对选择性集成的实现复杂度过高问题,借鉴群体智能方法,提出了基于蚁群优化算法的选择性集成算法ACOSEN,利用高速收敛的智能蚁群来选择差异大且精度高的个体学习器,建立最优的集成模型。在机器学习平台Weka上利用UCI数据库对ACOSEN进行了实验测试,实验结果表明该方法优于Boosting和Bagging方法,在正