基于图优化框架的数据维数约简方法及应用研究

来源 :国防科技大学 | 被引量 : 12次 | 上传用户:X395381435
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据的维数约简是统计学与计算机科学的新兴交叉研究方向。它所关注的问题是如何将高维数据表示在低维空间中,并由此发现其内在结构。本文从维数约简的必要性出发,在理论、方法和应用三个层次上系统地研究了维数约简问题。具体而言,本文的主要的贡献如下:1.提出了维数约简的图优化框架。将维数约简问题分为“从数据到流形”、“从流形到图”和“图上的优化准则”三个有机的部分。从理论上分析了高维数据位于低维流形上这一假设的合理性,讨论了流形上特征描述和图上特征描述的关系,并对图上的优化准则进行了深入的探讨。最后,在此框架下,对典型的维数约简方法进行了分析。此框架的提出不仅对下文中的方法和应用研究提供理论指导,而且有利于加深人们对维数约简方法本质的认识。2.在图优化框架下,对局部维数约简方法不稳健的原因进行了深入分析,通过添加全局信息和核变换,提出了稳健局部维数约简方法的框架,并对一些具体的方法进行了改进。同时,提出了局部线性变换嵌入算法,通过对数据进行局部线性变换,提高了限制最小二乘问题求解的稳定性。与原始方法相比,本文方法对噪声和参数有较高的稳健性,更加符合实际应用需求。3.从图优化框架中的构图出发,研究了数据类型不同(单视图和多视图)以及先验信息不同(正标签与负标签)情形下的维数约简问题,提出了三种半监督维数约简方法。基于调和函数的半监督维数约简方法能够有效地“扩大”先验信息量,改善维数约简方法的性能。首次研究了多视图数据的半监督维数约简问题,提出了多视图数据的半监督维数约简方法。首次提出了负标签的概念,并给出了能够有效利用负标签信息的负标签传播算法。上述研究不仅将维数约简方法扩展至半监督学习领域,而且具有广阔的应用前景。4.针对图像分类和聚类问题,通过描述图像数据的空间光滑性以及子空间基的正交性等特有性质,并充分考虑图像数据的低维流形特征,在图优化框架指导下,提出了三种基于子空间的图像分类和聚类模型。基于光滑正交子空间的图像分类模型充分考虑了图像空间光滑性与子空间基的正交性约束;在考察迹比值准则优良性、聚类标识流形光滑性以及图像空间光滑性的基础上,提出了迹比值准则下的图像聚类模型;为了在求解子空间时考察数据的非线性结构信息,首次阐述了模式收缩的概念,并提出了基于模式收缩的图像聚类模型。上述模型的提出不仅是对子空间学习研究的深化,对于指导实际图像的处理也具有重要意义。5.研究了高维对应问题,在图优化框架指导下,提出了两种基于维数约简的高维对应模型。基于最大差异延展算法的高维对应模型充分利用了最大差异延展算法的优良性能,将最大差异延展算法进行了扩展。局部近似最大差异延展高维对应模型则更加注重解决高维对应问题的实效性,并在互联网跨系统推荐中得到了应用。本文提出的模型不仅是对维数约简方法研究的有益扩展,对于解决实际问题也具有重要的指导意义。总之,本文围绕数据维数约简问题,对理论、方法和应用中的一些关键问题开展了系统的研究,构成了完整的研究体系,促进了维数约简问题研究的发展。
其他文献
大数据、人工智能、云计算、区块链、移动互联等“数智”技术全方位、多维度赋能档案治理,驱动档案治理立体化、系统性、整体式重塑。本文通过分析“数智”话语情境的全面来临和档案治理范式的数智化演进,提出从战略治理、数据治理、智慧治理、文化治理、生态治理五个维度构筑“数智”时代的档案治理路径,推动档案事业数字化数据化转型、智能化智慧化升级,增强档案治理能力,提升档案治理能级,助力档案治理现代化。
太赫兹技术是当下前沿技术领域中应用较为火热的一项技术,给工业发展、农业检测和国家国防事业带来创造性的发展。本文以农作物和农作物内部所包含的植物生长调节剂为研究对象,主要研究了以下内容:(1)获取了包括赤霉素、噻苯隆、氯吡脲在内的植物生长调节剂的太赫兹时域光谱,验证了不同种类的样品对太赫兹波的吸收程度不同,并通过计算获得了对应样品的相关参数如吸收系数、折射系数等。通过相关软件仿真实验,并结合实际实验
数据深度是表征高维数据空间中点与分布或数据云团接近程度的统计量,它为高维数据的排序提供了一个新的方向,已经成功用于稳健估计、数据判别分析等诸多领域。针对凸深度以及向量深度无法有效处理非凸数据和张量型数据的局限性,本文主要完成三个方面的工作:首先,针对深度的凸性问题,把数据深度扩展到再生核Hilbert空间(RKHS),以构建具有自适应分布(数据形状)的深度函数。主要包括:经典数据深度向RKHS的扩
航天技术转化活动是航天产业发展的重要环节。当前,我国航天技术转化动力不足,效率较低,规模和效益有限,产业化发展水平不高,其根本原因在于协同创新机制、转化评估机制尚未建立,市场导向尚不明确,亟待系统谋划布局航天技术转化应用发展路径。基于此,将战略性新兴产业的发展方向与可转化应用的航天技术融合,发展航天领域具有转化潜力的创新性、颠覆性航天技术,提出航天技术转化应用的重点工程和项目,
期刊
活性炭具有孔径分布均匀,比表面积大,物化性能稳定等特点,是一种优良的吸附剂,广泛应用于污水处理领域。通过物理或化学方法调控活性炭比表面积,并添加一些无机载体、复合菌种、有机营养物质构建的复合炭基生物增效材料,不仅具有良好的吸附性能,而且还能作为微生物的载体,可以发挥稳定的生物降解作用。以该炭基生物增效材料为基础,结合传统活性污泥法,衍生出的新型生物增效工艺,具有COD(化学需氧量)去除率高,硝化和
针对超临界二氧化碳(SCO2)旋转机械面临的严重泄漏、气流激振引发转子失稳等问题,以美国通用电气公司10MWe SCO2循环中高压涡轮的轴端密封为研究对象,设计了螺旋角15°和30°的螺旋槽、T型槽和ST型槽的四种槽型结构的干气密封。采用基于动网格技术和非定常CFD数值方法的微尺度摄动模型,研究了在实验边界条件下干气密封的稳态性能及在轴向简谐微扰动下SCO2涡轮轴端干气密封的非稳态动力学特性。对比
目前,人脸识别技术已经相对成熟,探讨该技术在不同领域内的应用势在必行。幼教行业较为特殊对于学生的行为轨迹及出入园安全有着更高的要求。基于此,将大数据系统引入幼教领域十分必要。本文在介绍了基于人脸识别的幼教大数据综合系统后重点从教师及学生的考勤、学生学习轨迹的跟踪与分析、学习行为评估、离校安全辅助等四个方面探讨其具体应用,希望为后续的引入及发挥价值提供必要参考。
期刊
模糊推理在模糊集理论中扮演着重要的角色.目前,模糊推理的研究已经取得了丰硕的成果.但基于单值智集的模糊推理算法研究成果很少,处于起步阶段.单值智集在处理不确定和不一致的信息具有显著的优势,并且可以有效避免信息的丢失.本文研究了基于单值智t-可表示三角范数的模糊推理算法和单值智集间的一种新的距离.具体研究内容及创新点如下:(1)给出了基于单值智t-可表示三角范数诱导的剩余蕴涵的模糊推理全蕴涵算法,证
温度作为最基本的物理参数之一,其准确检测对工业、军事、医疗、能源等领域都至关重要。相比传统测温方式,光学测温技术具有响应迅速、操作便捷、应用广泛等特点。其中,荧光强度比型(FIR)测温技术因能有效减少荧光损失、电磁场干扰等因素引起的测温误差而备受关注,该测温技术主要是基于稀土离子(RE3+)能级跃迁的荧光强度比来表征温度变化,已取得不错的发展,但是仍存在许多问题,如测温灵敏度和分辨率不高、发光效率
摘要:20世纪60年代美国的Maiman制成了世界上第一台红宝石激光器。在短短的几十年间,激光技术被快速地推广应用到了现代工业、农业、医学、通信、国防和科学技术的各个层面。其中,中红外~3μm波段激光由于处于水分子以及许多重要大气分子的吸收峰位置,在医疗外科以及环境监测等领域都有重要的应用潜力,开发出这一波段可用的相干光源将极大地推动科技文明的进步。光纤激光器具有能量可调与光束质量高的优点,一直是