高维统计学习问题的快速特征选择:贪婪逆尺度空间流方法

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:wvf170073269
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在本文中,我们探讨了高维度的机器学习问题。本文分析了高维问题所面临的挑战以及这些导致这些问题的原因。为了解决这些问题,机器学习在高维度下的模型和算法需要相应地重新设计。本文介绍了一些已有的工作,例如L0-正则化方法,L1-正则化方法和逐步回归方法。  本文主要工作是基于贪婪逆尺度空间流算法推广得到一种高维机器学习问题的方法—贪婪逆尺度空间流方法。该方法可以被广泛的应用于不同的机器学习模型。特别地,本文将强调该方法应用于线性回归和逻辑回归的情形。贪婪逆尺度空间流方法也适合于传感器不断产生数据或者大规模时间序列的情形,可以快速识别重要的节点或者时间点。  本文给出了一些机器学习的实际问题和模拟问题的算例,用以评价不同的变量选择方法。本文介绍了一些新的用于评价特征选择的尺度。这些尺度更适用于从不同的角度评价特征选择的结果。在这些算例中,贪婪逆尺度空间流方法的表现是符合预期的,特别是在选择效率上,相比于其他方法,贪婪逆尺度空间流方法具有显著的优势。
其他文献
随着Internet技术的飞速发展,各种Web信息系统大量出现,对其进行性能分析成为迫切的现实需要。本文从Web信息系统的运行机理出发,建立了系统的性能分析模型,然后借助于马尔可夫骨
风险在人们生活中无处不在,概率统计是人们研究风险的一个很好的工具.本文主要给出概率统计方法在火灾风险分析中的应用,并研究投资组合中的最优化问题. 随着经济的发展,火灾
本文主要介绍了一种新的数据分析算法,即张量投票算法.该算法完全利用图像数据,根据张量分析,矩阵论和几何的知识,对数据点进行编译和几何阐释,再根据心理学中的Gestalt原理制定一
采样问题主要研究如何利用采样点上的样本值去恢复或逼近原始信号。采样和重构是信号处理的基础,对现代电子工业技术的发展产生了巨大的影响。本文主要研究再生核空间中确定
复合随机动力系统是指具有随机参数的系统受到外部环境激励的动力系统,其能更准确地描述实际问题.经典随机振动系统的丰富动力学行为及应用被学者广泛研究,其中Hopf分岔是一
管理会计是预算管理工作中的重点,依据现阶段预算管理工作情况为基础,结合近年来管理会计特点,分析预算管理工作中管理会计的应用方向,并且结合实际发展需求,提出优质的推广
学位
本学位论文对一类捕食者-食饵系统和一类离散动力系统的稳定性及分岔进行了分析和讨论,全文共分为三章. 第一章,简单的介绍了非线性动力学和分岔的发展史,并列出了分岔的一些
本文研究了循环码的代数理论及其译码算法。论文利用循环码的根刻画方式,讨论一族设计距离为11的狭义本原二元BCH码及其对偶码。具体内容如下: (1)研究F2m上分圆陪集的计数
学位