距离度量学习及其在图像和视频分类中的应用

来源 :厦门大学 厦门大学 | 被引量 : 0次 | 上传用户:vazumi126
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网上图像、视频等资源的快速增长,其承载信息也趋向于多样化,网络信息的收集和分析变得越来越重要。因此如何对网络上图像和视频信息进行分类成为一个亟待解决的问题,而解决该类问题的关键则在于如何学习到适合处理大规模数据间相似度的度量方式。距离度量学习是一种研究样本之间的距离度量模型的算法,使得经过度量后的样本满足同类别样本之间的距离更近,而不同类别样本之间的距离更远。近年来,距离度量学习在机器学习、模式识别和目标分类等领域都有了较成功的应用。因此,研究样本之间的距离度量学习已经成为了图像和视频分类等领域的研究核心和热点问题。  本文首先在广泛调研文献的基础上总结了现存的距离度量学习算法,并介绍了几种常用的经典距离度量学习算法。其次结合现存度量学习应用中存在样本维度较高且特征不纯粹等特点,提出了一种基于低秩的距离度量学习算法,该算法学习一种低秩的度量矩阵将数据从原特征样本映射到一个更低维度的特征空间,在进行度量学习的同时对数据样本进行降维,有利于改进目标分类和人脸识别的性能。接下来针对距离度量学习在基于视频的动作识别领域的应用展开研究。视频中的动作识别问题常常具有特征空间类内距离较大且特征维度较高的特点,结合此特点我们采用了一种新的距离度量学习算法,在度量学习的同时对样本进行降维。本文中利用度量矩阵的Cholesky分解,将要求解的度量矩阵转换成一个低秩矩阵与它的对称阵的乘积,以期获得更好的动作识别效果。文章最后对距离度量学习中仍然存在的热点问题加以讨论并就其提出了一系列未来的研究方向。
其他文献
数字签名技术是网络信息安全中一种非常重要的技术,其在电子商务中具有重要应用。而代理签名的出现,给出了一种在电子化的信息社会里权力委托的方法。由于代理签名在电子现金
许多世纪以来,思想家和科学家一直在试图理解人的精神现象是如何产生的或人脑是如何工作的。自从上世纪20年代被发现以来,脑电(EEG)就成为临床诊断和科学研究中最有用的工具之
我国是一个拥有丰富水资源的国家,流速仪被广泛应用与测量河流和海流流速。为了保证流速仪测量流速的准确度,每年都要使用流速仪检定系统对大量的流速仪进行一次重新检测,确定其
工作流技术是目前计算机应用领域的研究热点,在项目管理、制造领域以及业务流程重组中有着广泛的应用。工作流就是工作流程的计算模型,即将工作流程中的工作如何前后组织在一起
数字认证水印技术是数字水印技术的一个重要研究方向,它在帮助保持和验证数字图像等多媒体的内容方面具有重要的价值。数字水印技术作为新兴的研究领域,在过去的几十年中得到
随着科技的发展以及人们生活水平的提高,用户已不满足于普通的家电设备,对于自我保护的安防意识也逐渐增强。同时数字家庭与3C逐渐融合,三网(电信网、计算机网和有线电视网)
自从互联网开始普及,人们就身处在一个信息爆炸的时代,人们对待生活、工作的思维方式开始逐渐在改变。在Web2.0的UGC(User Generated Content)时代,社交网络平台作为互联网发展
图片的前背景分离技术用以将一张图片中用户需要的前景区域抽取出来,是图形图像处理中一个重要组成部分,具有广泛的应用范围。为了适应现今动漫产业以及手机动漫的发展趋势,在对
作业是教学过程中的一个重要环节,现代教育技术的迅猛发展以及传统作业技术手段的落后使作业环节手段改革的问题被提了出来。远程作业系统在作业技术手段改革方面进行了有益
机制研究成为近年来研究的热点。一般的机制研究是采用解析的方法通过数学方程来描述元素之间、子系统之间、层次之间的相互作用以及系统与环境的相互作用,为了方便建立数学方程,一般会对组成系统的个体做同质性假设,而在现实系统中,个体之间往往是高度异质的,尤其是在市场这样的非线性系统中,这种解析的处理方法会导致模型与真实系统在总体上的严重背离。基于Agent的建模方法则可以解决传统方法所面临的难题。本文就是在