非负张量分解的算法研究及其应用

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:walkonair
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
非负矩阵分解(Nonnegative Matrix Factorization,NMF)算法实现简便,且具有较好的可解释性和明确的物理意义,应用广泛.随着信息技术的迅速发展,需要处理更高阶的数据,即张量,而这些数据往往具有非负性,如彩色图像、视频数据等.因此,非负张量分解的理论及算法研究受到广泛关注.目前,关于非负张量分解的研究主要是基于CP分解,其利用原有数据结构信息进行图像识别,但在可解释性和图像分类效果上有待提升.张量链(Tensor Train,TT)分解是高阶张量的另一种有效表示形式,不仅降低了高阶张量的存储和计算复杂度,而且在非负约束下,比CP分解具有更好的可解释性.因而,对非负TT分解的研究具有较强的理论和实际意义.为更好地刻画数据主要特征的稀疏性,本文提出一种基于TT分解的稀疏非负张量分解模型,即稀疏非负张量链分解(Sparse Nonnegative Tensor Train Factorization,SNTT),采用交替非负最小二乘法(Alternating Nonnegative Least Square,ANLS)和乘性迭代法(Multiplicative Update Rules,MUR)求解相应优化问题,并分析了这两种算法的收敛性.数值实验表明,与非负矩阵分解相比,稀疏非负TT分解的图像识别率明显提升,且MUR算法比ANLS算法的收敛速度更快,图像识别率也更高.本文内容分为五个章节,具体如下:第一章,介绍了非负矩阵(张量)分解的研究背景、研究现状以及本文的主要内容.第二章,回顾了Lee和Seung的非负矩阵分解算法,并给出在欧氏距离下目标函数的乘性迭代公式.第三章,简述与本文内容相关的基本概念及性质,给出非负CP分解、非负Tucker分解以及非负TT分解的基本概念,并推导了对应的乘性迭代公式.第四章,考虑稀疏正则化,提出稀疏非负TT分解模型,分别运用ANLS算法与MUR算法求解相应的子问题,并给出这两种算法的收敛性分析.第五章,运用MATLAB进行数值实验.在相同参数下,比较NMF和SNTT这两种分解算法的图像识别率,并研究训练集样本数、参数λ、TT秩对SNTTANLS算法图像识别率的影响.最后,将SNTT-ANLS和SNTT-MUR两种算法进行对比,得出SNTT-MUR算法收敛速度更快且图像识别率效果更好.
其他文献
情感分析技术旨在挖掘数据中蕴含的人类情感,被广泛用于舆情分析、智能商业等领域。细粒度情感分析从微观角度的方面词出发,捕获句中各个方面词的情感极性,提供更加细致的情感信息。细粒度情感分析的核心在于准确提取修饰方面词的意见词,但当今的主流模型在处理复杂句式结构的上下文时,存在多方面词与其意见词难以匹配的问题。此外,当文本句中含有反讽表达时,常规的情感分析方法难以推断出正确的情感极性,而反讽检测方法能有
学位
用B样条曲线拟合散乱数据点在计算机辅助几何设计中一直是重要的研究课题,渐进迭代逼近(Progressive Iterative Approximation,PIA)又是数据拟合中重要的方法,曲线的能量也是拟合过程中常需要考虑的因素。因此,用PIA方法实现带能量项B样条曲线拟合具有一定的研究意义。为了使B样条曲线在满足拟合误差精度的条件下能量最小,提出一种带能量项B样条曲线拟合算法。首先,用LSPI
学位
广义重心坐标提供了一种线性插值多边形或多面体顶点处数据的表示方法,因此广泛应用于颜色插值、基于笼子的变形等领域。虽然已经有许多关于广义重心坐标的研究,但如何以简便方法构造非负且光滑的重心坐标仍旧是热门课题。本文将某一向量视为正向向量,根据某些点与该向量的位置关系得到反向重心坐标。对于二维反向重心坐标,给定多边形及内部任意一点,将多边形的顶点投影到以坐标原点为圆心的单位圆上,然后计算相邻两点间的中点
学位
近年来,在工业物联网中设备飞速增长的同时,所产生的巨大数据量也让云服务器不堪重负,并且无法满足低延迟的处理需求。为了降低云服务器的计算压力、数据处理的时延以及保证交互的实时性,边缘计算被引入工业物联网。随着自动导引车(Automated Guided Vehicle,AGV)技术的发展,AGV辅助的移动边缘计算被应用在工业生产中并发挥着巨大的作用。AGV能够自主收集或从物联网设备上接收数据任务,并
学位
随着人工智能和物联网技术的广泛发展,如图像识别、智能语音等新兴应用在边缘设备上产生了大量数据。如何在保证用户隐私的前提下,充分利用人工智能挖掘这些数据的价值,已成为人工智能技术的一大挑战。针对这一挑战,谷歌提出了联邦学习方法,联邦学习的主要原理是联合数量众多的客户端共同训练同一机器学习模型,服务器在每轮训练中挑选一定量的客户端参与训练,客户端通过本地数据训练本地模型并上传到全局服务器,服务器通过对
学位
计算机心脏瓣膜流固耦合仿真在临床医学和理论医学上拥有重要的研究意义,但目前为止学术社区中的心脏瓣膜仿真方法都需要耗费大量仿真时间,提出一种快速的心脏瓣膜仿真方法是亟待解决的问题。本研究针对上述问题提出了一种快速的计算机心脏瓣膜仿真算法。在求解瓣膜小叶在心脏周期内形变的问题中,利用分片非均匀有理B样条(Non-Uniform Rational B-Spline,NURBS)曲面表示瓣膜小叶几何,并在
学位
随着信息技术的迅猛发展和普及,社会信息化程度持续提高,应用数据呈爆炸式增长。由于代价昂贵或设备故障,采集到的数据集往往是不完整的,这大大降低了数据的可用性。为进一步挖掘数据背后的价值,恢复缺失数据至关重要。然而,当前的数据通常具有多维结构,传统的矩阵填充方法难以处理。近年来,低秩张量填充(LRTC)模型因其能很好保留高阶数据的复杂结构,在视觉数据恢复、流量数据恢复等领域广受青睐。本文以张量列(TT
学位
Censor和Elfving于1994年首次提出分裂可行性问题,用来表示相位复原和医学图像抽象出来的数学模型问题.实际上,分裂可行性问题还可以应用到信号和图像恢复、基因调控以及医学调强放射治疗等方面.许多学者对此类问题进行了深入的研究,且提出了相关的迭代算法,如CQ算法、松弛CQ算法等.近年来,有不少学者提出了在Hilbert空间中的广义分裂可行性问题,如分裂公共不动点问题、分裂等式问题等,都是分
学位
图像分解是指将图像分解为卡通(cartoon)和纹理(texture)两部分,是图像处理中最基本的问题之一。图像恢复是将不清晰或信息不完全的图像还原为清晰或可识别的图像,它同样是图像处理中的一个核心问题。本文从图像分解问题出发,针对经典交替方向乘子法(ADMM)处理三块以上的凸优化问题不一定收敛的缺陷,提出具有全局收敛性的交替极小化方法实现分块低秩图像分解优化模型的求解。此外,我们基于分块低秩图像
学位
计算投影算子的次微分是数值最优化中的重要研究课题之一。本文主要以刻画一类特殊集合上的投影算子的次微分为主题展开。在此基础之上,本文的结果为一类优化问题的算法设计和理论分析提供可能。具体的,本文的主要内容可以分为以下两个部分。本文第三章主要聚焦在刻画到广义单纯形集合上的投影算子的B-次微分集合。该节主要利用了一种特殊的雅可比矩阵——Han-Sun雅可比矩阵。在引入了该矩阵之后,本章节完全刻画了到该集
学位