流形学习算法及若干应用研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户：linlinlin123456

【摘要】

：

信息化技术的快速发展及其广泛应用,使具有高维数的非结构化数据信息大量出现。高维使得这些数据的内在规律不仅超出人们的直接感知能力,而且很难被现有机器学习和数据挖掘算

【作者】

：

王庆刚

【出处】

：

重庆大学

【发表日期】

：

2009年期

【关键词】

：

流形学习维数约简方差分析人脸识别数据可视化

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

信息化技术的快速发展及其广泛应用,使具有高维数的非结构化数据信息大量出现。高维使得这些数据的内在规律不仅超出人们的直接感知能力,而且很难被现有机器学习和数据挖掘算法有效地处理。如何对高维数据进行有效维数约简,并由此发现其内在结构和规律已成为高维信息处理研究的关键问题之一。流形学习的主要目标是发现蕴含在高维数据集中的内在几何结构与规律性,是近年来机器学习和模式识别等领域一个新的研究热点。本文对流形学习算法及其应用问题进行了研究,主要工作及研究成果总结如下:①在对PCA和MVU算法分析的基础上,提出了有区别方差嵌入(DVE)算法。通过构造数据集的近邻图和非近邻图,DVE算法对样本方差采取了不同的处理方式,使低维表示全局方差最大的同时保持局部方差不变。DVE可以看作是PCA算法的非线性扩展,同时也可以看作是对MVU算法严格局部等距约束的松弛改进。DVE是一种全局维数约简算法,可以有效揭示蕴含在高维数据集中的全局几何结构和内在规律。与MVU和ISOMAP相比,DVE算法具有小的运算强度和存储需求。另外,DVE算法对具有等角映射特性的数据集有很好的降维效果,而ISOMAP和MVU的距离保持特性使得它们无法处理此类数据集。②DVE算法需要对稠密矩阵进行特征分解,尽管与ISOMAP和MVU相比,算法的计算复杂度有了很大的降低,但仍无法满足对现实世界中海量高维数据的实时处理要求。针对这一问题,提出了基于基准点的DVE快速算法(LDVE)。在保持近邻点间距离和不变的条件下,LDVE算法通过使随机选取的基准点间的距离和最大在低维空间中展开高维数据流形,算法的求解也同时转化为稀疏矩阵的特征分解问题,从而有效降低了计算强度和存储需求。③DVE算法得不到一个显式映射函数,无法对新增数据点进行有效处理,针对这一问题,通过对DVE算法进行线性逼近,提出了有区别方差投影(DVP)算法。和DVE算法一样,DVP算法在揭示数据集全局结构的同时有效保存它的局部结构,可以作为经典PCA和LPP的有效补充。④DVP是一种非监督维数约简算法,它并不能保证不同类别的数据点在低维投影空间中可以被有效分开。针对这一问题,提出了监督有区别方差投影(SDVP)算法。通过构造数据集的类内近邻图和类间图,SDVP算法使得高维数据集在低维空间中投影的类内局部散度最小,同时类间全局散度最大。SDVP可以看作是线性判别分析(LDA)的局部化形式,而边际Fisher分析(MFA)又可以看作是SDVP的局部化形式。SDVP算法对具有多模态或嵌入流形结构的数据集有好的分类效果。在UCI机器学习数据库和一些标准人脸数据库上的分类实验证明了算法的优越性。

其他文献

塔式起重机结构件测试方法

塔机许可证检查工作已进行几年了,通过对几十个企业的检查,发现结构件的垂直度超差现象较多。主要原因是缺少科学的产品质量控制手段。目前经常使用的检测方法有两种,一种是采用拉线再通过几何计算的方法。另一种方法是先用水平仪将吊臂小车轨道侧轴线超平,然后用经纬仪分划板竖线与吊臂同塔身联接铰孔轴线相靠求出差值进行计算(见图1)。

期刊

塔式起重机结构件测试法

浅谈温病气分证治

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们羽制作:陈恬’＃陈川个美食 Back to yield

期刊

气分证半表半里寒热如疟湿重于热吴鞠通少阳枢机

森林美剖析——主论森林植物的形式美

本文强调了森林美的多重性，系统地阐述了森林美的各种层次。分析了森林植物自然美的特征，并提出了森林植物自然美的构景原理。将距离和审美对象尺度两者相结合把森林植物景观区

期刊

森林美森林植物自然美景观形式美

寻找长寿的灵丹妙药

<正> 据英国《新科学家》杂志报道,美国科学家经过长期研究最近得出结论,以往研究认为的“处于饥饿状态可以使生物寿命延长”的传统说法已被突破,科学家们如今已经有了一个新

期刊

长寿NAD^+SIR蛋白质

与多个伙伴接吻会增加脑膜炎的危险

一项新的研究显示，与多个伙伴进行法国式接吻会使青少年患脑膜炎的危险增至4倍。

期刊

脑膜炎伙伴青少年法国式接吻

3D数字技术在旅游景区动画形象设计上的优势和实践

期刊

3D数字技术旅游景区动画形象设计

澳大利亚科学家发现“抗冻基因”

澳大利亚科学家最近发现了一种“抗冻基因”,这种基因使南极地带的草在-30℃的条件下仍可以存活.科学家们说,这种基因可以避免霜冻给农作物造成高达数百万美元的经济损失.

期刊

抗冻基因澳大利亚科学家经济损失农作物

图像匹配中若干关键问题的研究

图像匹配是计算机视觉、图像处理和模式识别中最重要的研究内容之一,最近几十年来一直是人们研究的难点和热点。它是多种图像处理及应用如目标识别、变化检测、三维建模等的

学位

图像匹配相似性准则主动表观模型Gabor小波偏最小二乘

粉末冶金技术在新能源材料中应用分析

随着科学技术、工业技术不断发展,能源紧张现象越发明显。此背景下,大部分国家均将新能源材料开发、应用作为重要发展战略。因此,为推动长期可持续发展战略实现,本文即针对粉

期刊

粉末冶金技术新能源材料太阳能

未来战争靠＂病毒＂

<正> 军事科技专家认为:“计算机中28克硅产生的效应,可能比1000千克铀产生的效应还大。”但当你操作计算机时,一些“病毒”可能已无声无息地偷袭了计算机系统,并最终掌握了

期刊

计算机病毒战争信息战计算机安全

流形学习算法及若干应用研究

与本文相关的学术论文