基于间隔分布的Boosting算法研究

被引量 : 0次 | 上传用户:wy83902
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Boosting是机器学习领域一种流行的、用来提高学习精度的设计框架,它通过若干个弱分类器的线性组合构造一个强分类器,使该强分类器的分类精度远高于单个弱分类器。AdaBoost是Boosting类算法中最具代表性的算法,经验表明AdaBoost的推广性随着弱分类器数目的增加而增加,但罕有过拟合现象发生。这一现象吸引了众多后续研究并导致若干理论上的解释,其中最成功的当属Schapire的间隔理论。间隔理论表明训练样本的间隔分布对推广性的影响至关重要,然而间隔分布的好坏是一个模糊概念,因此最近提出的许多算法都是通过优化某个间隔好坏的度量函数来获得一个好的间隔分布,从而提高推广性。本文的研究主要围绕基于间隔分布的Boosting算法,主要工作总结如下:1.回顾了AdaBoost、L2Boost、LPBoost、AdaBoost-CG与MDBoost等典型的Boosting算法,并分析了它们的参数对间隔分布的影响以及间隔分布对推广性的影响。2.提出了一个称之为MCBoost的新颖算法。不同于以往算法对间隔分布的间接控制,MCBoost通过优化一个间隔调节参数来直接控制间隔分布。MCBoost的实现采用了列生成技术,因此保证了快的收敛速度,使最终获得的组合分类器由尽可能少的弱分类器构成。通过实验我们证明了MCBoost在推广性上的优越性。3.将间隔控制思想推广到SVM算法领域,提出了一个新颖的改进算法G-SVM。实验证明,G-SVM获得的支持向量的稀疏性远优于传统的SVM算法。我们同时设计了G-SVM的多类算法,其复杂度仅等价于两类问题的SVM。
其他文献
专利权经济价值评估是指按照一定的理论和方法,对专利未来法定期限内可为专利权人所带来的超额收益进行的评估。目前,专利权经济价值的实现、对专利权进行科学的价值评估等,
环保和新国标要求含SO2气体排放浓度严格低于400mg/l。为达到该要求,烟气脱硫效率的高低就成为影响脱硫指标中最后也是最关键的一步。对该过程进行传质、反应动力学及热力学
未成年犯在生理、心理、认知模式等方面都与成年犯有很大的区别和特殊性,对其进行的社区矫正必须具有区别于成年犯矫治的特点。作为一项新型的司法社会工作,目前我国尚未从制
在MMS-2A滚动摩擦磨损试验机上进行不同材料车轮与U75V热轧钢轨的匹配试验,研究材料特性对轮轨试样磨损与疲劳性能的影响.结果表明:随着车轮碳含量增加,组织中珠光体比例增加
无线传感器网络(Wireless Sensor Network WSN)是由多个低功耗的传感器节点以Ad-hoc方式组织起来的网络,在场境监控领域有着广泛的应用。作为一种新兴的计算环境,无线传感器网络
供热管道直埋技术近年来在设计及施工方面都发展迅速,国内东北地区是应用最早也是最广泛的地区。在改扩建、新建的热水管网工程中大多采用了直埋敷设方式,并取得了明显的经济和
随着现代社会的不断进步,全球化的飞速发展以及日益频繁的国际交流,作为沟通的桥梁,口译的地位已变得越来越重要。因而,对口译人才的需求也更加强烈。如今,口译已经成为个高
目的制备并鉴定抗酵母菌烯醇化酶单克隆抗体杂交瘤细胞株.方法用面包酵母烯醇化酶做抗原,用细胞融合技术制备单克隆抗体,并采用ELISA法对单克隆抗体进行筛选和鉴定.结果建立
<正> 我国的国营大中型企业,在几十年社会主义建设中发挥着重要作用。但是,自改革开放发展有计划商品经济以来,它又面临着许多困难。资金紧缺、成本上升、虚盈实亏、经济效益