快速降维算法研究

来源 :南京大学 | 被引量 : 0次 | 上传用户：dalianwaiguoyu

【摘要】

：

随着大数据时代的到来,我们处理的数据量和数据维数都在不断地增加,而这也对我们的计算机提出了巨大的考验。虽然现在很多高性能的电脑可以处理这样的大数据,但是却要花费大

【作者】

：

梁雨

【出处】

：

南京大学

【发表日期】

：

2004年期

【关键词】

：

数据降维流形学习平面数据

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着大数据时代的到来,我们处理的数据量和数据维数都在不断地增加,而这也对我们的计算机提出了巨大的考验。虽然现在很多高性能的电脑可以处理这样的大数据,但是却要花费大量的时间和空间,而且由于维数诅咒的原因,往往处理的效果也不尽人意,因此,如何对这些数据进行数据降维,也就成为了一个亟需解决的问题。基于投影的降维方法在进行降维时速度很快,但是它们作为线性方法,对于非线性的数据处理效果不佳。而流形学习是从尽可能保持原始数据的内在结构的角度进行降维的方法,是解决非线性降维问题的重要手段之一,近年来也引起了广泛的关注。但是在流形学习降维的过程中,其生成流形的参数十分敏感,降维速度也很慢。此外,这种针对向量数据降维的方法,在类似图像这种平面数据上使用会破坏平面数据中相邻数据之间的相关性,使得降维结果不尽人意。本文分别从这两个方面出发,研究了降维算法的背景和发展历程,提出了两种方法来解决这些问题,在人工数据集和真实数据集上进行了实验,并结合实验结果进行参数分布和时间复杂度的分析。本文的主要贡献概括如下:●梳理了数据降维方法的发展经历,并重点介绍了以主成分分析为代表的线性降维方法,以局部线性嵌入为代表的非线性降维方法,针对图像这种平面数据进行降维的2DPCA算法,处理图像数据常用的卷积神经网络。●针对经典的流形学习算法参数敏感,降维速度慢的问题,我们提出了一种基于流形学习的快速数据降维算法SOINN Manifold(Self-Organizing Incremental Neural Network Manifold)。从大量的原始高维数据中,自动地提取出少量的可信代表点来表示原始数据所在的流形,再进行数据降维,极大地提高了降维的速度。在生成流形的基础上,我们又提出了一种流形内在维数的估计方法来自动地确定降维的目标维数,从而提高降维的效果。●针对经典的向量数据降维算法会破坏平面数据中相邻数据之间的相关性,使得降维结果不尽人意的问题,我们提出了一种专门针对平面数据的降维算法IOCANet(Incremental Orthogonal Component Analysis Network)。我们将卷积神经网络和数据降维算法相结合,用无监督的降维算法来替代有监督的训练自动地生成卷积核,节省了大量的训练时间,同时也不需要对数据进行人工标注。实验中还证明了我们的算法无论是在大数据集上还是小数据集上都能取得并不弱于常用的有监督学习算法的效果。

其他文献

GPS／Galileo双模捕获引擎的VLSI实现

随着卫星导航进入多星座时代,兼容GPS和Galileo的双模接收机成为目前卫星导航接收机设计的热点。捕获是卫星导航接收机基带信号处理的关键部分之一。本文通过对两种信号捕获算法的分析,提出了一种可以兼容GPS和Galileo信号的捕获引擎的VLSI结构。该结构兼顾了GPS和Galileo的信号特点,可以对GPS信号进行时域并行搜索和对Galileo信号进行时域部分并行搜索。最后给出了该结构各个组成单

期刊

快速捕获匹配滤波器GPSGalileo双模VLSI实现fast acquisition match filter GPS Galileo dual m

正常翼外肌与翼外肌痉挛的肌电变化

目的:对正常翼外肌、翼外肌痉挛患者进行研究,探讨正常翼外肌、翼外肌痉挛的肌电特征.方法:以35例单侧翼外肌痉挛成人患者为实验组,35例正常人为对照组.采用ZEP-500型诱发电

期刊

翼外肌痉挛肌电变化颞下颌关节诊断治疗

雷公藤多甙对哮喘大鼠肺组织基质金属蛋白酶9及其抑制剂1表达的影响

目的:探讨雷公藤多甙对哮喘大鼠肺组织中细胞外基质相关因子基质金属蛋白酶9及金属蛋白酶组织抑制因子1的表达的影响.方法:①实验于2004-01/09在南京医科大学实验动物中心、

期刊

哮喘金属蛋白酶类金属蛋白酶1组织抑制剂雷公藤

大鼠脑缺血后树突状细胞参与脑损伤过程的作用及其免疫活性

目的:证明大鼠脑缺血后树突状细胞(dendritic cell,DC)是否参与脑损伤过程和所具有的免疫活性.方法:用线栓方法封闭大鼠右侧大脑中动脉制作动物模型.用免疫组化染色方法检测

期刊

大鼠脑缺血树突状细胞脑损伤免疫活性动物模型检测

针灸保护胃黏膜与热休克蛋白的关系

目的从多方面探讨针灸治疗保护胃黏膜是否与热休克蛋白的诱导有关。资料来源应用计算机检索M edline1985-01/2004-12和Em base1985-01/2004-12有关针灸、胃黏膜保护和热休克

期刊

针灸疗法热休克蛋白胃粘膜

港珠澳大桥沉管混凝土成熟度与氯离子扩散系数相关性研究

采用化学结合水法、氯离子快速测定法（RCM法）和混凝土成熟度测定法研究了56 d龄期内混凝土氯离子扩散系数和混凝土成熟度的关系,结果表明：混凝土氯离子扩散系数不仅随养护龄期的

期刊

混凝土成熟度氯离子扩散系数相关性

高效做好当前地方海事办公室管理工作刍议

作为综合部门,办公室担负着承上启下、沟通内外、协调左右的枢纽作用。任务繁杂、责任重大,是局领导的参谋智库、同志们的后勤保障。本文深度剖析当前地方海事系统办公室管理

期刊

地方海事办公室管理高效务实

基于流形学习的滚动轴承故障识别的研究

滚动轴承是旋转机械中关键的零部件之一,也是应用最广泛的零件。滚动轴承的运转状态直接影响整个设备的正常运行,由于其自身工作特性以及所处的工作环境导致滚动轴承较容易发

学位

滚动轴承故障诊断流形学习支持向量机

新形势下如何做好基层种子管理工作

分析了我国基层种子管理工作的现状,研究其管理过程中出现的问题,并针对问题研究了相关解决方案。

期刊

基层种子管理现状措施

煤矿采空区充填用煤矸石泡沫混凝土发泡剂的研究

为防止地表沉陷,煤矿采空区需要充填,目前采用的充填方法为胶结充填、高水速凝充填等。泡沫混凝土具有质轻、流动性好的特点,可作煤矿采空区的充填材料。制备低水泥用量、含

期刊

环境工程学泡沫混凝土发泡剂煤矿采空区充填煤矸石

快速降维算法研究

与本文相关的学术论文