选择性集成学习研究与应用

来源 :厦门大学 | 被引量 : 0次 | 上传用户:olddai1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
集成学习利用现有简单学习算法共同解决一个问题,能够显著提高一个学习系统的泛化能力,对于未知的对象给出尽可能精确的估计。由于集成学习所具备的优势,近年来对其理论和算法的研究成为机器学习领域的热点之一。然而,为了获得满意的精度,集成大量的基分类器需要大量的存储空间并且使得预测速度明显下降,同时由于集成了大量冗余基分类器,影响了学习系统整体的泛化性。2002年,周志华等人研究首先证实,并非所有基分类器参与集成的效果是最好,并且提出了“选择性集成”的概念。选择性集成学习是在已生成的多个基分类器的基础上,基于某种选择策略只从其中选择一部分用于构建集成分类器。本文在深入学习选择性集成研究以及与其相关理论的基础上,从混合模型方面进行了相应研究,主要完成以下工作:  (1)本文提出了将基于聚类的集成修剪和动态选择与循环集成框架相互结合的混合模型。首先基于K-均值聚类算法的集成修剪算法剔除冗余的基分类器。然后,为了避免使用枚举法并且能够获得更好的集成性能,通过改进动态选择与循环集成框架,利用顺序选择策略对处理过的候选分类器集合进行集成学习。在多组实际数据集上进行对比实验,验证该模型处理二分类问题的有效性。  (2)本文将混合模型应用于音乐流派分类,考虑到音乐分类属于多分类问题,为了提高乐曲的识别精度,利用交叉验证对基分类器的参数进行初始化。实验表明混合模型适合处理音乐流派分类问题,并且通过交叉验证优化参数进一步提高性能。  (3)通过问题转化方法衍生出应用于多标记分类的混合模型。在多标记数据集上进行对比实验,实验结果验证了混合模型在多标记问题上的可行性。
其他文献
卡口车辆信息检测识别是智能交通的重要环节。目前的汽车卡口车辆信息检测识别在检测特征上比较单一,主要实现对车牌的检测,多数应用于停车场或道路汽车管理和收费。但在智能交
学位
草图识别是草图理解的关键。手绘草图是一种结构化数据,草图符号的结构信息能够表达丰富的语义,对草图的识别具有重要作用。现有的草图识别系统通常把草图映射为特征向量,这
学位
随着互联网技术的发展,人们可以方便的从网络中获取越来越多的资源,特别是多媒体技术的日渐成熟更是推动了人们对信息共享的依赖。同时,这种高度依赖也对网络资源共享效率提出了
工作票制度是电力系统中保障运行管理工作安全的一项重要措施。工作人员在变电站、输电线路上进行检修、试验、清扫等工作前,必须填写相应的工作票以说明工作内容和需做的安全
图形口令作为一种新型的身份认证方式,在从提出到现在仅仅十多年的时间里,受到越来越广泛的重视,已经成为身份认证领域的研究热点之一。本文对图形口令机制发展中的若干问题进行
机器人学是一门集机械、控制、电子以及计算机科学等多个学科交叉于一体的新兴技术。随着工业4.0时代的到来,工业机械臂的避障路径规划问题已成为当今机器人研究领域上的一个
学位
学位