处理分类数据问题的Boosting与Lasso方法

来源 :中国人民大学 | 被引量 : 0次 | 上传用户:mxltx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要从模型、算法、模拟效果三个方面阐释了目前比较热点的解决分类问题的Boosting方法和Lasso方法。在模型部分,文章归纳了三种损失函数:指数损失函数、负对数似然损失函数、平方误差损失函数,并选取了三种基础学习器代表:简单分类二叉树,简单回归二叉树、维成分回归基,详细解释了Boosting方法和Lasso方法基于适宜的损失函数和基础学习器,并选择最佳谓整参数建立模型的过程。在算法上,本文以Boosting的向前逐步可加Logistic回归算法和Lasso的最小角回归Lars算法作为算法建模的代表,探讨了这两种方法均属于逐步可加模型的相关理论。在模拟研究部分,文章利用十二组不同特点的数据,区分了解决分类问题的几种典型的Boosting方法和Lasso方法在处理高维数据、自相关数据上的不同表现,从分类结果和变量选择两个方面,给出了Boosting和Lasso两种方法在处理不同数据上的比较。
其他文献
武汉,我国著名的历史文化古城,是白云黄鹤的故里,是全国建城最早的特大城市,是中部地区的工业、金融、商业、科研和文化教育中心,是现代“中国光谷”高科技光电技术产品生产
宏观压力测试通过分析在发生概率小但可能造成严重后果的极端宏观压力情景下金融资产或金融机构的可能遭受的重大损失,揭示金融机构的薄弱点和脆弱性。压力情景设计则是宏观
本文在参考文献[4]和[11]的基础上,具体地得到一个高斯整数π,使得对[4]中定义的δn(D),有δ1(π)=1.并且对[4]中的定理2(ii)中的δn(D)=1.用[11]中的方法给出一种比较形象化的
本论文包含四章内容。第一章列出了正文中要用到的一些基本定义及符号。   第二章主要讨论了具有投射盖的模构成的类的一些性质,并利用这一模类和一些经典的模类的包含关系
黄金具有货币和一般商品的双重属性,由于其价值相对稳定,是非常理想的避险工具。我国的黄金价格与国内外经济的发展、通货膨胀的程度以及货币政策等宏观因素有着诸多的联系,
作为处于恶劣海洋环境中的一种典型建筑物,海洋平台除了承受结构自重和甲板设备重量等静态载荷的作用之外,也不可避免地会受到波浪力、风、地震、冰、海流等外部动态载荷的作用.在这些载荷中,波浪力、风以及地震是常见的典型动态载荷.目前针对波浪力作用下的海洋平台减振控制做了大量的研究,而对于地震作用下的海洋平台减振控制还缺乏研究.虽然地震载荷没有波浪力和飓风载荷持续的时间久而且发生的频繁,然而地震的强烈振动会
由于大多数Hamilton系统都不可积,因此构造新的可积系统是可积系统研究领域具有挑战性的工作.通过对已知的有限维可积系统添加合适的扰动项产生新的有限维可积系统是很自然的
支持向量机是在统计理论的基础上产生的,它在经验风险和结构风险最小化能力上有着良好的学习泛化能力。SVM有着其它的一些特性,其训练相当于求解一个线性二次规划问题,并且SV
问题新闻报道的界定问题新闻报道是通过媒介对在日常生活中存在或显现出的,给人们的生活带来有一定影响,主要是消极、负面、甚至是具有危害性的,值得关注的那些具有普遍性与
该书由清华大学材料系盖国胜博士主编,中国轻工业出版社出版。该书内容丰富,综合了超细粉碎、超细分级和表面改性方面的研究成果及工业应用的经验,集理论和实践应用于一体。联系