基于黎曼流形优化的数据降维表达及应用

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:xxq0108
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据时代,计算机和多媒体技术迅速发展,每时每刻都在生成大量的图像和视频数据。面对如此海量的数据,不仅有效识别它们已经成为一项巨大挑战,甚至简单的存储和读取都会存在困难。数据降维表达是解决数据存储、读取及识别等问题的一种重要手段。因此数据降维表达已成为人们广泛关注的课题,并取得了丰硕成果。传统的数据降维表达方法主要是基于欧氏空间进行建模和优化。在欧氏空间中处理一些具有约束的问题常常使用拉格朗日法或贪婪算法,而这些方法往往会导致次优解的生成。为了在数值计算中获得更精确的数值解,黎曼流形优化开辟了一个新的方向。采用黎曼流形优化有两个显著的优势:第一,对于许多具有黎曼几何结构约束的优化问题,通过黎曼流形上的优化可以更好地利用约束空间的几何结构,转化为黎曼流形上的无约束优化问题,从而获得更精确的数值解。第二,通过引入适当的度量,可以将某些欧氏空间中的非凸问题转化为黎曼流形上的凸问题,进而改善数值计算方法,获得全局最优解。鉴于黎曼流形优化的优势,本文研究黎曼流形上数据降维模型的建立和优化问题。论文的主要创新性工作包括以下几个方面:第一,针对黎曼流形优化算法使用函数一阶信息收敛速度慢的问题,本文提出黎曼流形上的加速优化算法(Fast Optimization Algorithm,FOA),并在理论上证明了该策略的函数值序列具有的收敛率。另外,针对低秩表示问题,本文提出了基于黎曼流形的増广拉格朗日法,并使用快速优化算法进行优化。实验结果表明,黎曼流形上的快速优化算法确实起到加速效果,同时,黎曼流形上低秩表示获得较高的聚类正确率。第二,针对偏最小二乘回归问题,现有方法都是在欧氏空间中建模和优化。对偏最小二乘回归因子的正交约束或者广义正交约束,通常都是采用贪婪算法逐列求解,这常常只能获得次优解。为了克服这一缺点,本文提出了黎曼流形上的偏最小二乘回归模型及优化算法,该算法对偏最小二乘因子进行整体优化,获得更精确的数值解。此外,为了避免过拟合问题,提出黎曼流形上的稀疏偏最小二乘回归模型,并将其应用到图像分类问题。实验结果表明,与同类回归方法相比,本文提出的黎曼流形优化模型和算法具有最高的分类正确率。第三,针对具有拉普拉斯噪声图像特征降维表达,基于欧氏空间的方法都是通过极大化低维特征方差矩阵的L1范数进行建模,然后采用贪婪算法优化,贪婪算法虽然计算复杂度低,但往往导致生成次优解。因此,本文将投影矩阵的正交性约束看作乘积流形,提出乘积流形空间上的L1范数的二维主成分分析模型,对投影矩阵进行整体优化,获得更精确的数值解。实验结果证明,和同类降维方法相比,使用乘积流形上的降维模型和优化方法,能够更好的去噪和提取特征。第四,针对主成分分析只考虑了数据特征的线性相关性,而高维数据特征之间常常具有非线性相关性。为了解决这个问题,本文提出一种基于深度参数化学习的最大相关主成分分析模型,该模型利用深度参数化框架,将具有非线性相关的数据特征映射为线性相关性特征,再进行主成分分析降维。并进一步推导出模型的学习算法。实验结果表明,与常用的线性和非线性降维算法相比,本文提出的算法在模拟数据集和几个真实数据集上都获得了较好的识别率。
其他文献
1手机程序的应用1.1队员进行运控球练习时,教练手持手机,屏幕变绿时,表示“绿灯”,可以快速运球;屏幕变红时,表示“红灯”,必须马上踩住足球。
1996年7月,经过海宁市档案局(馆)同志的努力和宋云彬先生家属的支持,宋云彬先生生前的一批珍贵文档,回归故乡,人藏海宁市档案馆。其中包括先生与社会名流各时期拍摄的照片、友朋的
近年高血压药物治疗取得很大进展,但高血压治疗率和达标率低的状况仍未得到明显改善,一些新的治疗手段的发展为高血压治疗提供了新的选择。雷帕特降压仪通过减慢呼吸频率达到
针对一类单自由度含间隙和预紧弹簧的弹性碰撞振动系统的分岔控制问题,提出了一种基于Lyapunov指数及径向基函数神经网络的分岔预测及控制方法.首先建立了系统的Poincare映射
【目的】研究烯酰吗啉对土壤呼吸强度和微生物多样性的影响,为烯酰吗啉的正确合理应用提供指导和科学依据。【方法】称取2kg供试土壤,在土壤中施用不同含量的烯酰吗啉水溶液,
<正>~~
会议
中职学生在学校里不仅是简单的学习知识技能,更为重要的是对职业素养的培养。在这个过程中,对学生的德育教育尤为重要。怎样抓好德育教育,让学生的德育思考落到实处?将德育教育与
目的: 分析细节护理在医院消毒供应室中的应用效果.方法: 选取我院2016年1月至12月未采取细节护理的消毒供应室作为对照组,2017年1月至12月采取细节护理的消毒供应室作为观察组
数字化背景下传统图书馆的运作模式正在转型和变革,图书馆馆藏资源建设需要适应数字时代发展的需求,不断加强数字化建设、扩大服务范围。党校图书馆建设特色数据库,是数字化