高维统计学习问题的快速特征选择：贪婪逆尺度空间流方法

来源 :上海交通大学 | 被引量 : 0次 | 上传用户：wvf170073269

【摘要】

：

在本文中，我们探讨了高维度的机器学习问题。本文分析了高维问题所面临的挑战以及这些导致这些问题的原因。为了解决这些问题，机器学习在高维度下的模型和算法需要相应地重新设

【作者】

：

胡堃

【机构】

：

上海交通大学

【出处】

：

上海交通大学

【发表日期】

：

2016年期

【关键词】

：

高维度机器学习贪婪逆尺度空间流变量选择

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在本文中，我们探讨了高维度的机器学习问题。本文分析了高维问题所面临的挑战以及这些导致这些问题的原因。为了解决这些问题，机器学习在高维度下的模型和算法需要相应地重新设计。本文介绍了一些已有的工作，例如L0-正则化方法，L1-正则化方法和逐步回归方法。　　本文主要工作是基于贪婪逆尺度空间流算法推广得到一种高维机器学习问题的方法—贪婪逆尺度空间流方法。该方法可以被广泛的应用于不同的机器学习模型。特别地，本文将强调该方法应用于线性回归和逻辑回归的情形。贪婪逆尺度空间流方法也适合于传感器不断产生数据或者大规模时间序列的情形，可以快速识别重要的节点或者时间点。　　本文给出了一些机器学习的实际问题和模拟问题的算例，用以评价不同的变量选择方法。本文介绍了一些新的用于评价特征选择的尺度。这些尺度更适用于从不同的角度评价特征选择的结果。在这些算例中，贪婪逆尺度空间流方法的表现是符合预期的，特别是在选择效率上，相比于其他方法，贪婪逆尺度空间流方法具有显著的优势。

其他文献

基于马尔可夫骨架过程的排队模型及其在Web信息系统中的应用

随着Internet技术的飞速发展，各种Web信息系统大量出现，对其进行性能分析成为迫切的现实需要。本文从Web信息系统的运行机理出发，建立了系统的性能分析模型，然后借助于马尔可夫骨

学位

Web服务器Web信息系统休假排队模型马尔可夫骨架过程

若干风险问题分析——火灾风险统计分析与最优风险组合

风险在人们生活中无处不在，概率统计是人们研究风险的一个很好的工具.本文主要给出概率统计方法在火灾风险分析中的应用，并研究投资组合中的最优化问题. 随着经济的发展，火灾

学位

火灾风险风险统计最优风险组合概率统计

张量投票算法及其应用

本文主要介绍了一种新的数据分析算法，即张量投票算法.该算法完全利用图像数据，根据张量分析，矩阵论和几何的知识，对数据点进行编译和几何阐释，再根据心理学中的Gestalt原理制定一

学位

张量投票算法算法理论图像处理数据分析

再生核空间中信号的平均采样和重构

采样问题主要研究如何利用采样点上的样本值去恢复或逼近原始信号。采样和重构是信号处理的基础,对现代电子工业技术的发展产生了巨大的影响。本文主要研究再生核空间中确定

学位

平均采样有限样本再生核空间齐次型空间随机过程

白噪声激励下一类有界随机参数系统的Hopf分岔及控制研究

复合随机动力系统是指具有随机参数的系统受到外部环境激励的动力系统,其能更准确地描述实际问题.经典随机振动系统的丰富动力学行为及应用被学者广泛研究,其中Hopf分岔是一

学位

有界随机参数系统Gaussian白噪声次序正交分解Hopf分岔分岔控制

浅谈管理会计在预算管理中的应用

管理会计是预算管理工作中的重点,依据现阶段预算管理工作情况为基础,结合近年来管理会计特点,分析预算管理工作中管理会计的应用方向,并且结合实际发展需求,提出优质的推广

期刊

管理会计预算管理应用企业管理

非线性色散方程的单峰孤立波解与周期波解

学位

两类非线性指数型离散动力系统的稳定性和分岔分析

本学位论文对一类捕食者－食饵系统和一类离散动力系统的稳定性及分岔进行了分析和讨论，全文共分为三章. 第一章，简单的介绍了非线性动力学和分岔的发展史，并列出了分岔的一些

学位

离散动力系统非线性动力学稳定性Flip分岔

循环码理论及其译码算法研究—设计距离为11的二元BCH码构造及其B-M迭代译码算法实现

本文研究了循环码的代数理论及其译码算法。论文利用循环码的根刻画方式，讨论一族设计距离为11的狭义本原二元BCH码及其对偶码。具体内容如下： (1)研究F2m上分圆陪集的计数

学位

循环码译码算法迭代译码二元BCH码

矩阵Schur补的性质及应用研究

学位

高维统计学习问题的快速特征选择：贪婪逆尺度空间流方法

与本文相关的学术论文