基于属性泛化的动态集成学习算法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:my_sunday_tongxing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
集成学习是近年机器学习领域的研究热点之一。集成学习的基本思想是,首先通过多个基分类器对问题进行分类,然后利用某种方式对分类结果进行综合,以得到更准确的结果。其中,基分类器间是相互独立的。动态集成技术则是通过动态地选择部分而非全部的分类器参与集成,或者动态调整参与集成的基分类器的权重,以获得更高的分类准确率,是进一步提高集成系统分类性能的重要手段。自然数据中广泛存在层次特征。本文主要研究如何基于数据的层次性特征,来构造高性能的动态集成分类器。本文的主要研究工作如下:(1)针对具有层次性特征的数据集,提出了基于泛化属性值划分方法的集成学习算法GAVPEL。该方法利用属性泛化技术,根据数据的层次结构,将训练集划分成不同层次和粒度的子训练集,并在每个子训练集上生成基分类器;在分类时,根据其条件属性值动态地选择相关的基分类器参与集成,并利用投票方法来综合各基分类器的分类结果。实验表明,该算法比传统的Bagging和AdaBoost算法更加有效。(2)由于属性在不同泛化方式下会产生不同的泛化路径,为此,本文在GAVPEL算法的基础上提出了M2算法。该算法利用可能的多种泛化路径,建立MRML模型,根据该模型进行训练集的划分,并在每个划分的子训练集上建立基分类器;在分类时,选择多条泛化路径上的基分类器同时参加集成,分类结果仍采用投票法进行合成。试验表明,该算法不仅能提高集成系统的分类性能,而且还能提高系统的鲁棒性。
其他文献
在现有基础上人们对生活质量的要求愈来愈高,为了达到目标便不可避免地需要长期工作而导致劳累、困乏,在静态情况下发生困乏只需要休息就可以了,而当驾驶员在疲劳状态下继续
无线传感器网络是21世纪备受关注的研究热点之一,已广泛应用于军事国防、医疗护理、城市管理、地震监测、设备监测、建筑物结构监测等明显带有一定实时性需求的领域。本课题
现实世界中,语音信号很难避免受到各种噪声源的污染,语音增强的一个主要目的就是从带噪信号中尽可能的恢复出纯净语音信号。语音增强技术在语音信号处理的各个领域比如语音的
背景建模作为计算机视觉的一个重要内容,它在智能交通、人机交互、智能视频监控等系统中被广泛应用。具体的说,这些系统的底层通常使用背景建模方法来获取运动目标,因此,背景
随着网络技术和数字设备的发展,数字数据分布变得越来越容易也越来越快,信息通过因特网传输几乎无处不在,由于数据通信渠道的安全性缺陷,出现了诸如非法复制、伪造和诈骗等一
交通系统是一个庞大复杂的系统,具有随机性、复杂性和不确定性等特点。如今的交通控制大多以经典交通流理论与普通的控制理论原理为基础,较少涉及交通流混沌控制研究,混沌控制的
数字3C加速融合的时代,以影音播放为代表的嵌入式多媒体处理有着广阔的市场空间,机顶盒、智能手机、平板电脑等嵌入式终端逐渐占领消费类电子市场,用户不断增长的需求对嵌入式多
负责计算最优路径和转发数据的无线传感器网络路由协议在整个无线传感网体系中起着关键的作用,路由协议的好坏直接决定了网络的性能、生存期、健壮性等指标。   论文针对当
Internet的蓬勃发展,网络已经在人们的日常生活中扮演着越来越重要的角色。但是,随之而来的网络攻击手段也愈来愈复杂化、多元化、智能化。如何保证网络不受网络攻击入侵破坏
在信息技术飞速发展的今天,计算机技术已经渗透到各行各业,成为人们工作生活中不可或缺的技术手段,所以人们对软件系统需求的规模和复杂度也是日益扩大和提升。由于上述原因,