基于稀疏约束的流形数据相似性度量学习研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:cares
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着现代科学技术的不断发展,流形学习已经成为信息科学领域的重要的研究方向之一,在真实世界中,存在很多高维度的流形数据,如果直接对这些高维数据操作会面临很多的困难,所以解决高维数据所面临的问题是如今的难题,经过许多学者的不断钻研,很多经典的流形学习方法被提出,这些流形学习方法主要被分为两种,线性的流形学习算法和非线性的流形学习算法,但研究者们发现线性学习方法并不适合具有高维非线性结构的流形数据,因此,提出了一种新的方法即在流形数据上学习一种非线性映射,使得映射之后的数据依然具有流形结构。拉普拉斯特征映射(LE)是一种基于图论的方法,是一种非线性的降维方法,主要思想是通过构建邻接矩阵来重新构建数据流形的局部结构特征,是从局部的角度去考虑构建数据的关系,希望在降维后依然能保持之前数据的结构,所以相近的点在降维后的空间中尽可能的靠近,也就是说相近的数据点在降维后相似度更高。对于流形数据,我们通常使用相似度度量方式来得到不同样本数据的相似度,常用的传统的相似度度量方式有余弦相似度,调整余弦相似度,Jaccard相似度和皮尔逊相关系数等。一个好的相似度度量不仅可以明显的提高算法的分类的准确率,还可以更好的反映流形数据间的结构,若把数据样本对应空间中的数据点,则点间距离远近反映了样本数据间的差异,距离越近,相似度越大,距离越远,相似度越小。所以在此基础上本文提出了一个新的流形数据的相似度学习方法,主要思想是尽可能的让同类间的样本相似度更大,不同类间的样本相似度更小。本文的主要研究内容如下:(1)基于拉普拉斯秩约束的相似度学习算法研究。对于高维数据来说,很多特征都是无效的,我们希望能在高维的数据中提取出有效的部分,来让我们的结果变得更加准确,低秩可以自动分离噪声和干净的数据,若在算法中加入低秩则可以获取更为有效的数据,基于这个理论想法,我们把秩约束加入到算法中,提出了一种基于拉普拉斯秩约束的相似度学习算法,并详细介绍了相似度算法的迭代求解过程,然后在多个数据集上进行实验和跟别的算法比较来验证我们算法的有效性。(2)基于流形数据的多视角相似度学习算法研究。在许多现实世界的应用程序中,实际数据的表示方式不是单一的,而是具有多种表达形式,例如一个人从不同的角度观看,就可以从不同的角度收集不同的信息。通常对于每个事物,我们都可以从不同的角度观察从另一个角度无法观察到信息,因此,为了了解事物更全面的信息,我们可以从多个角度观察来获得更多的信息。与单视角算法相比,把多个视角的信息进行融合的多视图算法可以得到更好的效果。所以我们提出了一种基于流形数据的多视角相似度学习算法,并详细介绍了算法的迭代求解过程,在一些数据集上进行了大量实验并比较了单视角算法和多视角算法的实验结果,验证了多视角算法的高效性和鲁棒性。(3)基于拉普拉斯秩约束的多视角相似度学习算法研究。在这一工作中,我们结合了前两个工作的想法,即保持数据的多样性,也保持数据的有效性,我们将低秩想法融合到多视角相似度算法中,提出了一种基于拉普拉斯秩约束的多视角相似度学习算法,并给出了对应的算法求解过程和迭代求解公式,最后在多个数据集上进行大量的实验来验证算法的有效性。
其他文献
增强现实技术是当前智能化技术及应用推进中被重点研究与应用的技术之一,而增强现实系统是智能制造领域的重点研究对象之一。在增强现实系统中,如何恢复正确的虚实遮挡关系是
当前我国正处于深化供给侧结构性改革的关键时期,面临着产能过剩、经济增长动力不足等众多问题,经济政策的不稳定性不确定性明显增加。已有的经济政策不确定性研究集中在其对宏观经济、企业行为决策的影响上,对金融基金的研究却鲜有涉及。近些年,基金的流动性管理问题成为学界关注的重点,因此本文就经济政策不确定性对开放式股票基金资产流动性管理影响的问题进行实证研究,考察在面临经济政策不确定时,基金将如何管理资产的流
微波加热由于其作用机理不同常规加热方式,因此具有加热均匀、选择性强、环保节能的优异特性,且加热时存在非热效应的作用,对于反应过程过程有着特殊的催化作用,从而在微波化学领域,如何利用这一特性便成为研究学者们关注的重点。同时,又由于微波化学反应器中电磁场的分布与腔体的类型、结构参数息息相关,所以设计一个能高效率利用微波能量的化学反应器便成为了难点。本文基于商业项目“油页岩等含油混合物的微波地面干馏”,
基于微扰近似的传统凝聚态理论通常难以有效描述涉及强耦合系统的各种物理现象。从全息原理和超弦理论中发展出的AdS/CFT对偶,将强耦合的多体问题转化为弱耦合的经典引力问题
求解非线性约束最优化问题常用的方法是罚函数法和序列二次规划方法(Sequential Quadratic Programming),它们都是将约束优化问题转化为无约束优化问题求解.其中,罚函数法一直
随着科学技术的进步,机器人被广泛应用到各个领域,例如工业、军事、医疗等。而立方体机器人是机器人研究中的典型代表,由于其系统具有典型的非线性、强耦合、多变量等特点,因此对其平衡控制方法的研究具有一定的挑战性。本文以立方体机器人为研究对象,研究立方体机器人单面和立体的平衡控制问题。首先,设计了一种立方体机器人结构,并在此基础上建立其动力学模型;其次,基于立方体机器人动力学方程建立其状态空间方程,分析了
目前火山岩油气藏正在引起广泛关注,但其复杂程度超过其他油藏类型。准噶尔盆地金龙2井区佳木河组火山岩具有复杂多变的岩性,常规方法难以准确识别;裂缝的发育与火山岩油藏有
图像匹配是将不同图像转换到一个坐标系下的过程,它可以是多张来自不同传感器、不同光照或不同视点的照片。传统匹配算法通过三步来对图像进行匹配,首先是对图像提取关键点,然后对关键点进行特征提取,最后按照关键点个相似度和鲁棒估计来计算透视变换矩阵。跨源图像指的是多张来自不同传感器、不同生成方式或者不同模态的照片,与图像匹配类似,匹配的困难程度与图像视点和光照强度的剧烈程度是成正比的。经过实验证明,目前大多
本文密切结合国家发展高端装备制造业的重大需求,在国家自然科学基金项目及山西省留学人员科研资助项目基金资助下,系统研究了高速电主轴壳体单元的动力学建模、模型精度研究、动力学参数研究及动态设计等问题,并将理论成果用于高速电主轴壳体单元参数优化设计中。论文取得如下成果:(1)在主轴壳体单元动力学建模方面,基于波动法完成了电主轴壳体单元的振动动力学建模,即基于Flügge壳体理论和波动法理论,建立壳体频率
《大众日报》是山东地区创刊最早、办刊时间最长、影响最大的红色报刊,更是中共在山东地区实现马克思主义大众化的中介。马克思主义的理论不仅要武装党员、干部,更要为中国民