基于Boosting的集成树算法研究与分析

来源 :中国地质大学(北京) | 被引量 : 0次 | 上传用户:rylove006
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
集成树算法是近年来机器学习领域热门的算法,尤其是XGBoost算法。2014年,陈天奇发布了XGBoost的第一个公开版本。2015年,XGBoost算法在各项算法大赛上取得了优异的成绩。在Kaggle数据挑战赛中,29个冠军案例中有17个采用了XGBoost算法,其中有8个解决方案仅仅使用了XGBoost算法就取得了成功。相比于单个的决策树算法,集成树算法能够得到较高的预测能力,并克服单个决策树难以解决的问题。集成树算法是决策树算法与集成算法的集合。以决策树作为基学习器,使用不同的集成方法可以构建出不同的集成树算法。集成算法主要分为两大族算法,分别是Boosting与Bagging。本文主要对以Boosting为基础的集成树算法进行讨论。首先,对集成树算法的基本理论,包括决策树的基本概念,以及集成的概念、集成的基本方法等。其次,介绍了三种集成算法,分别是AdaBoost、GBDT与XGBoost算法。其中AdaBoost算法是以样本权重的重建为基础,而GBDT与XGBoost算法均是以梯度提升为算法核心,后者是在前者基础上经过多方面的改善发展而来的。同时,对Boosting算法中的正则化手段给予阐述与试验。最后,将算法应用在岩性识别数据集上,对算法的精确性、计算速度以及抗噪性进行了对比,XGBoost方法在多方面出于领先地位。然后将XGBoost算法应用于图像分类,提出了CNN-XGBoost算法模型,其能够有效提高图像分类的精确度。
其他文献
随着全球性环境危机的加剧,特别是近代工业发展以来,工业污染日益严重。人们开始寻求新的环境管理手段和工具,经历了从末端处理到清洁生产的发展过程后,生态工业的概念得到越
果实软化是由细胞壁结构和组分的变化引起的,果实细胞壁的主要成分为果胶、纤维素和半纤维素,还有少量的蛋白质。根据近年来国内外有关果实成熟软化的研究现状,从细胞壁的化
在苏东剧变以后的30年里,对从"原苏东地区"延续下来的国家和对苏联的继承者俄罗斯、南斯拉夫的继承者塞尔维亚来说,社会转型和社会发展是主要内容。然而,对其他在剧变过程中
工业机器人是智能制造业最具代表性的装备,集加工精密化、柔性化、智能化、数字化等先进制造技术为一体。在当前智能制造逐渐普及的情况下,职业院校也多开设了《工业机器人应
目的:调查研究罗定市生江镇居民对中医药的态度和对中医药发展的期望,提出提高广东农村中医服务质量和促进中医发展的对策。方法:采用问卷调查的方法,随机选择200名不同年龄
目的比较体表心电图鉴别右室流出道室性期前收缩具体起源点的诊断价值。方法分析经射频导管消融治疗室性期前收缩靶点明确为右室流出道的139例患者(其中右室流出道间隔部起源
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
融媒体是随着信息技术的不断发展而出现的一种新型媒体,其出现为作为新闻信息获取有效途径之一的新闻采访带来了新的发展机遇,但同时也使其陷入了发展的困境。本文主要是在分
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield