基于带约束矩阵的图像表示与检索算法研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:xiawei0018
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能手机的发展,以及以微信为代表的移动社交应用的普及,移动互联网中图像的数据量正呈指数型增长。不仅图像的数据量在增加,其清晰度也随着采集设备的发展被不断提高。高清图像给用户带来更直观、更生动、更细腻体验的同时,也意味着相关学习算法需要处理的特征维度更高。高维特征不仅带来了存储和计算等方面的代价,更对传统算法提出了严峻的挑战,如“维度灾难”。此外,图像管理技术如图像检索(尤其是跨媒体图像检索)的重要性也随着海量图像数据的出现而凸显。本文围绕图像应用领域的基础问题——图像表示和热点问题——跨媒体图像检索,展开深入的研究。图像表示是指将图像表示成特征空间中的特征向量,用作后续算法(如:图像聚类、图像识别、图像检索等)的输入的过程。有效的图像表示方法不仅能降低数据存储,传输和学习成本,更能刻画图像的潜在几何结构和发掘其语义信息从而提升学习效果。考虑到图像数据集一般都可以以低秩矩阵的形式表示,本文从近年来非常流行的非负矩阵分解算法出发,针对经典非负矩阵分解算法在用于后续学习时的稳定性上的不足和其在保持数据的局部性和稀疏性上的缺陷,提出了带约束的非负矩阵分解算法。图像检索,尤其是跨媒体图像检索(如使用文本检索图像)对海量图像数据管理至关重要。跨媒体图像检索的核心问题是不同特征空间的向量之间相似度的计算问题。现有的跨媒体图像检索算法基本是围绕着如何将不同特征空间中的数据映射到相同公共子空间这一研究问题而展开。在这一框架下,上文中的单模态图像表示算法难以被有效利用。基于带约束的低秩矩阵恢复,本文提出了一种全新的跨媒体图像检索算法。该算法可以充分利用单一媒体上学习得到的低维图像表示和不同媒体间数据的关系,来同时保持数据的全局和局部一致性。具体来说,本文的主要工作概括如下:1.稀疏编码仅仅是传统非负矩阵分解中的一个附带功能,在大多数情况下非负矩阵分解并不能得到较好的稀疏表达,以致将这类低维表示用于其他学习任务(如分类,聚类等)时并不能获得最优的性能。针对这一问题,我们改进了非负矩阵分解的进化算法一一概念分解算法,提出了基于局部坐标约束的概念分解算法(Locality-Constrained Concept Factorization, LCF)。 LCF在原始概念矩阵分解模型中引入了基于局部坐标编码约束的正则项,该正则项通过约束概念(即基向量)尽量靠近数据点来达到每个数据点可以被表示为更少的基向量的线性组合的目的,即稀疏编码的目的。我们使用和原始NMF类似的乘法更新规则对此问题求解。基于真实数据的聚类实验表明:此方法学习到的低维表示可以同时具备稀疏性和局部性,具有更强的表示能力。2.目前非负矩阵分解的改进工作都是针对非负矩阵分解这一过程本身,而很少考虑学习得到的低维表示的后续使用。我们考虑当非负矩阵分解得到的低维表示用于统计分析,如线性回归时的情况。从增强后续线性回归模型的稳定性和减小其预测误差的角度出发,我们使用了最优化实验设计的方法对非负矩阵分解的低维表示进行了约束。另外,针对NMF无法保持数据的潜在流形结果的缺点。我们进一步引入了Hessian正则约束,相比于常见的拉普拉斯正则约束,它具有更好的泛化能力。最终,我们提出了一种基于A优化和Hessian正则的非负投影算法(A-Optimal Non-negative Projection with Hessian regularization, AHNP)。AHNP不仅仅能学到基于局部且保持流行结构的低维表示。最重要的是,此表示后续用于回归分析时,学习到的回归模型具有更好的稳定性,更低的预测误差。为了求解最终的优化问题,我们提出了基于乘法更新的优化算法。3.考虑到传统图像表示算法学习得到的低维表示适用于图像分类,图像聚类,目标检测,图像检索等诸多领域,而无法直接用于跨媒体检索。我们针对跨媒体检索提出了一种全新的基于低秩矩阵恢复的半监督学习算法——基于低秩矩阵恢复的跨媒体成对约束传播算法(Matrix Completion for Cross-view Pairwise Constraint Propagation, MCPCP)。 MCPCP将跨媒体检索看作关联矩阵补全问题,矩阵中的元素表示对应的图像和文本的相关程度。MCPCP使用单模态的图像(文本)表示算法学习得到的特征表示来构造单模态上的近邻图,并基于此近邻图引入流形正则达到保持数据在单模态上的局部一致性的目的。另外,通过约束关联矩阵为低秩矩阵,MCPCP同时保持了图像和文本数据的全局一致性。为了高效求解最终的优化问题,我们使用了易于并行化的ADMM算法。
其他文献
近期,新三板市场出现数起做市商被处罚的案例。开源证券因其自营账户和做市账户同时持有同一只股票而被全国股转公司责令整改,英大证券因交易员错误下单导致相关做市股票价格瞬
报纸
动物世界里存在着各种各样的感觉:动物以某种形式捕捉周围环境的能量,然后把它们变成可提供有用信息的感觉.这些信息包括目前所处环境种类,这片土地(海洋或天空)属于谁、谁在
2016年,网络危机事件频发,这种新型的社会危机给组织的生存以及发展都带来了很大的影响。其中,"和颐酒店女生遇袭事件"与"魏则西事件"都是十分典型的网络危机事件。经过对这
我国茧丝质量不高,与茧丝大国地位不相称,其根源在于未能很好实施优茧优价政策;“蚕茧大战”推波助澜,导致蚕茧质量下降,并暴露出行业在管理、体制、对市场的调控等方面存在
就像香港导演张彻正宗明朝风格的《龙门客栈》一度风靡武侠电影界一样,当今中国明朝风格的家具正风靡美国和全世界。
电子病案信息共享是一个长期复杂的系统工程,在这一过程中的问题并不是一朝一夕能够解决的,需要大量的人力物力进行解决。本文对这些问题如何解决进行一些探讨和研究并给出了一
共享经济目前已成为一种趋势,共享单车作为共享经济的一种典型表现形式,为大众所广泛熟识,目前的共享单车市场竞争非常激烈。文章基于微观经济学的市场结构理论,分析了当前共
随着互联网技术的发展,人们使用网络的方式发生了显著的变化。由互联网用户自身行为产生的数据量呈现爆炸性的增长。面对如此庞大的资源,使得想要为用户准确、快速地找到感兴
曾经常与热水器、电视机等家电厂商打交道的王冬,近来对足球赛事关注颇多。王冬曾在苏宁易购家电公司担任多年高管,今年初,他被调往苏宁体育集团担任常务副总裁,全面负责PP体
通过对该机的实际使用,阐述了拉茎辊、剔除板、摘穗板间隙和粉碎机留茬高度的调整,并对主离合器的使用和关键部位的润滑作了介绍。