多流形数据建模及其应用

被引量 : 9次 | 上传用户:hanjzh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
许多数据集可以通过一些简单几何对象的混合来建模,即多流形数据建模,比如众所周知的NIST手写体数字数据集和人脸数据集。有效地模拟及分析这类数据的数学模型是一项具有挑战性的数学问题。在本世纪初的早期工作,建模数据的有效方法是使用单一流形,其思想是把一组在高维空间中的数据在其潜在的低维空间流形中表示出来,其主要目的是期望寻找产生数据集的内在规律性,即从观测的现象中去寻找其本质。不同于单流形学习,多流形数据建模的目的是把输入数据集分为若干个类别,使得每个类别中的数据点都来自单一、简单、低维嵌入流形。假定一组数据来自于多个流形,多流形数据建模的目标为:分析各子流形的数目和它们分别的维数;数据的划分(数据属于不同的低维流形);数据在对应低维流形的嵌入。多流形数据建模可揭示数据的潜在空间分布规律,为解决多流形结构等复杂的数据,本文从头部姿势估计和人脸识别问题出发提出了几种多流形数据建模方法。主要工作和创新点包括以下几个方面:1.提出了监督流形嵌入的头部姿势估计方法:很多数据降维的方法可以用于流形嵌入进行头部姿势估计,但面临的困难是如何创建一种有效的嵌入算法,既可以很好地保留姿势信息,又可以忽略掉与姿势无关的图像变化信息,如身份、背景等信息。在引用姿势标签信息的同时使用了身份信息来指导流形学习,本文提出了监督的流形嵌入(Supervised Manifold Embedding, SME)算法,以期望学习头部姿势特征的同时去除身份等信息的影响。实验结果表明:头部姿势图像在低维嵌入空间中有很好的类内聚集性和类间分离性。2.提出了基于近邻传播聚类的多流形数据建模方法:为进一步学习不依赖于身份的头部姿势特征,本文提出使用多流形来对头部姿势数据建模。一方面,因为身份所带来的变化是在低维姿势空间中流形嵌入的平移,旋转和扭曲等;另一方面,由于身份的变化,严重地影响了单流形嵌入的光滑性和判别性。因此本文提出了基于近邻传播聚类的多流形嵌入(Multi-Manifold Embedding,MME)算法,该算法采用多流形来建模头部姿势图像,每一个流形来刻画具有相似外观的个体的姿势流形。实验结果表明:多流形建模提高了头部姿势估计的准确率。3.提出了基于投影聚类的多流形数据建模方法:针对个体进行近邻传播聚类时,个体的特征维数很大,导致聚类的有效性降低。因此,本文使用投影聚类的思想方法来解决这个问题,提出了基于投影聚类的多流形数据建模方法,包括三个阶段(寻找相似单纯形、流形嵌入和K流形聚类)来建模头部姿势多流形,减弱了“维数灾难”的影响,实验结果表明:该方法可以提高头部姿势在低维嵌入空间中的类内聚集性和类间分离性。4.提出了基于组稀疏性和非负性矩阵分解的多流形数据建模方法:使用L1/L2正则化方法来对矩阵分解的系数矩阵H进行列的组稀疏约束,可得到由多个流形投影矩阵组成的基矩阵W。本文提出了组稀疏非负矩阵分解(Group Sparse Non-negative Matrix Factoriza-tion,GSNMF)算法。通过组稀疏和非负矩阵分解把数据空间建模为多流形空间,其中每一流形属于一个类别。对于任意测试图像,可以使用学习到的多流形投影矩阵的线性组合来表示,其得到的表示具有自然的组稀疏特性:仅其对应的相同类别的系数为非零。本文将该算法应用于人脸识别,取得了较好的人脸识别率。
其他文献
中小城市的路内外停车设施是组成城市静态交通系统的硬件基础,承担着动态交通两端的集聚与消散作用。随着城市化进程的不断加快,机动化水平的不断提高,这个不仅带来了交通拥堵问
电动汽车的车载电源电能补给站的配置水平、快速高效充电技术以及车载动力电池能量管理技术都是电动汽车产业发展的瓶颈,因此本文针对电动汽车充电站高频软开关智能充电技术做
目的:通过建立温病湿热证大鼠模型,观察大鼠血清、舌组织IL-23和IL-17表达的水平变化,以及加味藿朴夏苓汤干预治疗后对二者的影响,探讨IL-23和IL-17在湿热证发病中的作用和意
目的研究甜茶护齿含片对口腔致龋变形链球菌的葡糖基转移酶和水不溶性胞外多糖的影响,为开发利用以天然植物甜茶提取物为主要成分的甜茶护齿含片提供实验依据。方法1.配制变
目的:通过回顾性分析78例诊断海绵窦受侵的鼻咽癌患者的资料,探讨鼻咽癌海绵窦受侵的临床特点和相关预后因素。方法:收集广西医科大学附属肿瘤医院2005年8月至2006年12月收治的
本论文是关于我国上市商业银行动态竞争力影响因素的实证研究。在我国以银行业为主导的金融体系中,商业银行动态竞争力的效率直接影响和制约着中国经济、金融的变革和良性成
随着城市绿化步伐的加快,北京市枯枝、落叶、草屑、花瓣及其它绿化修剪物等园林绿化废弃物出现大量堆积的情况,预计2012年理论数量将达到534.85万吨。采用传统方式进行填埋、
X射线无损探伤是广泛使用的汽车轮毂质量检测方式。国内的汽车轮毂厂商通过在线检测系统获得轮毂的X射线图像后,大多采用人工方式来评定产品的质量,大大降低了生产的自动化程度
针对近些年高等院校招生规模不断扩大,出现学生知识基础和学习能力参差不齐的实际状况,提出工科院校大学物理课程实施分层次教学模式。既通过教学目标分层、课堂教学分层、测试
随着全球经济一体化的深入拓展,金融和贸易日益成为驱动经济增长的核心和发动机,作为理论研究和实证检验的延伸,金融发展理论和国际贸易理论出现了日益融合的发展趋势,成为近