在线学习的集成分类器研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:codeandme
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在互联网领域,数据集是随着时间的推移不断产生的,所以在完整的数据集上进行机器学习是个几乎不可能的事情,这就需要学习器能够不断地进行学习,而传统的机器学习方法已经无法满足这一要求。在线学习就是针对上述情况应运而生的,目前在线学习的主要技术手段是增量学习。另一方面,支持向量机(SVM,Support Vector Machine)作为机器学习领域的一个重要研究分支,因为自身完善的数学理论和良好的实际应用效果,目前在很多领域都获得了应用。但支持向量机属于性能稳定的分类器,不能进行增量学习,并有“灾难性遗忘”现象。所以如何让支持向量机应用到在线学习领域,也成为了目前的研究热点。本文针对这一问题,进行了如下工作:首先,先简要介绍了支持向量机的数学理论基础、基本概念和算法优势。然后,详细地介绍了一种支持向量机的快速分类算法。该分类算法根据样本集的几何结构信息,先从样本集中挑选出位于样本集最边缘位置的样本—壳向量,并将其组成新的样本集,进行支持向量机的训练,从而找出最优分类超平面。由于在对样本集进行壳向量提取时,采用的是线性规划的运算操作,其次壳向量集组成的新样本集只是原样本集的一小部分,所以能有效地降低二次规划运算过程的复杂度,从而达到提高训练速度的目的。另外提取壳向量集时,支持向量等关键样本也同样被提取出来,不存在丢失现象,所以对原算法的精度不会造成太大影响。最后,本论文在上述算法的基础上提出了一种基于壳向量的支持向量机Learn++集成方法。该方法将壳向量引入到支持向量机基分类器的训练过程中,并对基分类器采用Learn++集成,使得集成后的支持向量机分类器不仅能够有效地进行增量学习,而且缩短了训练时间、减小了存储规模。实验结果表明,集成后的支持向量机分类器不但具有在线学习的能力,而且还可以避免“灾难性遗忘”现象的产生。
其他文献
初中时期是人生中的黄金时期,对人日后的发展有些至关重要的作用。而活动教学法作为最有效的教育方法,对提高人的整体素质有着不可替代的作用,英语对我们的重要性也越来越高,所以
RoboCup小型足球机器人系统是运动足球与人工智能领域多智能系统相结合的产物,它融合了机器人学、智能控制、图像处理、无线通信以及机械设计等多个学科,间接反映了一个国家
随着电磁理论研究的不断发展和实际工程要求的不断提高,计算电磁学中对分析精细复杂目标的电磁特性受到了广泛关注。电场积分方程方法作为一种精确的计算方法,被广泛地应用于提取电路参数和分析目标散射特性。但是当目标物体的剖分尺寸远远小于波长,传统的电场积分方程会发生低频崩溃。人们对有关电场积分方程方法的低频崩溃问题做了不少研究。这归根结底是由于有限的计算机精度使得低频时矢量磁位的部分被忽略,而剩下的标量电位
左手材料是一类按照一定结构合成的人工媒质,并在特定的电磁频段范围内同时具有负介电常数ε和负磁导率μ。这种材料的奇异特性能够在微波、天线、射频和光学等领域发挥重要的作用。作为一种人工媒质,左手材料的制备通常在一般媒质中嵌入设计的几何谐振结构,组合形成天然媒质不具有的电磁特性。本文围绕左手材料的设计,提出了一种基于匚形金属条的单面二维左手材料,具有二维左手特性、频带高适应性、单元尺寸小等优点,并研究了
学位
红树林是热带、亚热带潮间海岸带重要的生态系统类型,为了解和掌握红树林湿地碳储量及其价值,本研究对海南东寨港红树林湿地碳储量进行了研究,并对其固碳价值进行估算。首先
《数学课程标准》对学生发现问题、提出问题、分析问题、解决问题的能力做出了明确要求。通过《数学“问题解决与学习评价”模式研究》课题的实施,结合新课标的要求,对数学问题
超宽带(UWB)通信系统与传统无线通信系统相比,具有容量大、速率高、安全性高、成本少、功耗低等等优点,因此UWB技术应用地越来越广泛。UWB无线信道是超宽带通信系统的一个重
以29个薄壳山核桃无性系为研究对象,对其生育酚、鞣花酸、色氨酸等进行了测定和分析,揭示了不同薄壳山核桃无性系中功能性成分含量的差异,为薄壳山核桃无性系的综合评价及利
随着广播形式的多样化,卫星广播技术进入了实际应用阶段。卫星广播具有覆盖面积大,受自然环境影响小以及节目容量大的特点。但跨区域的广播站点要实现广播同步一直是卫星广播
本文以4种有机蔬菜为研究对象,以系统动力学(SD)理论为基础,以vensimPLE软件为技术平台,建立有机蔬菜生长及碳收支估算模型。选取生菜(叶菜类)、黄瓜(瓜类)、番茄(茄果类)及