基于潜在变量的图像理解研究

来源 :中国科学院研究生院中国科学院大学 | 被引量 : 0次 | 上传用户：Evilkonata

【摘要】

：

图像理解中的图像匹配、图像分类和目标检测是计算机视觉和模式识别领域中的基本问题和重要环节。它们是摄像机标定、基于图像的目标三维重建、基于内容的图像检索、目标跟踪

【作者】

：

余轶南

【机构】

：

中国科学院大学

【出处】

：

中国科学院研究生院中国科学院大学

【发表日期】

：

2012年期

【关键词】

：

图像理解潜在变量模型目标检测 SPM方法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

图像理解中的图像匹配、图像分类和目标检测是计算机视觉和模式识别领域中的基本问题和重要环节。它们是摄像机标定、基于图像的目标三维重建、基于内容的图像检索、目标跟踪、行为识别等研究的基础。并且,它们的研究直接影响着智能视频监控、网络图像内容理解与管理、大规模视频数据挖掘等实际应用的发展。对它们的研究具有重要的科学理论意义和实际应用价值。　　当前的研究内容主要是建立在基于图像处理的图像特征提取和基于数理统计方面的机器学习理论。这些方面的研究在过去多年中取得了十分惊人的进展,甚至在一些方面取得了较为令人满意的研究成果和实际应用。然而,在图像理解领域,当前的研究成果相比于人脑的识别能力还存在较大的差距。这些差距体现在计算机视觉算法对图像或目标的视角变化、光照变化、空间位置变化、目标之间的遮挡等问题的判别力和鲁棒性上。这也是当前图像理解领域中较为困难的研究内容。基于潜在变量的模式识别方法是一种较新的建模方法。基于潜在变量的模型在考虑图像的可观测数据的同时,对图像的潜在数据进行建模,并在模型学习中全面的考虑图像的可观测数据和图像的潜在数据,从而建立更加鲁棒并具有较高判别力的模型。　　本文主要围绕着图像理解中的图像匹配,图像分类和目标检测三个方面的具体内容进行研究。本文的研究重点就是在基于潜在变量的模型总体框架下,针对这三个具体问题,如何建立具有针对性的潜在变量模型和设计有效的模型学习方法,开展以下的工作:　　 ①基于潜在图像姿态和光照的图像匹配方法。图像匹配的核心内容是将两幅图像中的相同目标匹配在一起。通常的方法是从图像中抽取视角和光照不变的特征点。本文所研究的内容是当图像发生较大的视角或光照变化时,或对小视角或轻微光照变化鲁棒的特征检测子和特征描述子失效时,如何高精度匹配两幅图像。本文认为,不存在完全不变的特征检测子和描述子,从而舍弃设计新的检测子和描述子的思路,转而另辟蹊径,以图像潜在变量挖掘为基础,通过抽取待匹配图像中目标之间的潜在姿态和光照信息,将大视角和强光照变化的图像匹配问题转化为一个小视角、弱光照变化的图像匹配问题,从而降低图像匹配的难度,提高图像匹配的精度。　　 ②基于潜在图像结构变量的图像分类方法。以图像的潜在结构信息为切入点,解决传统的基于视觉词典(Bag of Visual Words,BoVW)[1]模型的图像分类框架中如何描述图像的空间结构关系的问题。图像的空间结构在图像分类中具有决定性的作用,而传统的视觉词典模型对图像的空间结构关系的考虑较为简单。其中应用比较广泛的是空间金字塔匹配(Spatial Pyramid Matching,SPM)[2]方法。SPM简单的将图像划分为不同的区域,并在每个区域提取图像的BoVW特征,从而隐式的嵌入图像的空间结构关系。然而,由于图像结构具有一定的灵活性,而是用固定分块的方式无法捕捉这种变化。因此基于SPM的方法还具有一定的局限性。本文提出了一种基于图像潜在结构变量的空间金字塔匹配方法。该方法建立在传统的SPM方法之上,是对SPM空间位置信息表达的一种改进。该方法通过挖掘图像的潜在结构关系,可以更加灵活的描述图像的空间结构,从而进一步提高图像分类的性能。　　 ③基于潜在遮挡变量和潜在上下文变量的目标检测方法。对于目标检测,本文研究由于目标遮挡引起的图像表达问题。本文提出基于潜在遮挡变量的目标表达模型来改进传统的目标检测方法。在对目标的描述中,该模型可以自动的分析目标的遮挡情况。在训练过程中,目标被遮挡的部分将不会影响分类器的训练。在测试过程中,图像的遮挡部分不会影响分类器对目标的打分。　　另外,当前的目标检测算法主要关注基于目标本身的描述方法,对图像中目标与目标之间的关系,目标和场景的关系,也就是上下文信息考虑较少。本文在传统的目标检测方法基础上研究图像的上下文信息。特别的,我们在目标检测方法中引入潜在上下文模型,可以显著的改进传统的上下文模型对上下文信息中噪声敏感的问题,从而更加有效的去除目标检测中的误检测。

其他文献

计算机辅助肝外科手术规划中医学图像分割算法研究

肝脏是人体最大的实质性脏器,在新陈代谢中有重要作用。全世界每年肝癌死亡人数达到一百万,肝癌的死亡率位居我国癌症死亡率第二位,是严重影响人民健康水平的疾病。传统的肝

学位

计算机辅助技术肝外科手术图像分割算法拓扑结构工作原理支持向量机

基于Erlang的XMPP即时通信系统的研究与实现

随着即时通信系统的不断普及和推广，即时通信系统的研究也越来越受到大众的关注。即时通信系统的出现，增加了人与人之间的交互的便利性，大大提升了人们工作和学习的效率。这种新

学位

即时通信系统Erlang编程语言并发性能鲁棒性Web客户端

永磁直线同步电机的往复式运动控制策略研究

直线电机是一种直接将电能转化为直线运动的机电装置，与旋转电机相比较，直线电机具有推力大、速度快、结构简单、运行效率高等特点。随着加工技术以及材料学的发展，具有“高响应

学位

直线同步电机运动控制推力波动RBF神经网络混合控制器

旁路换热网络的裕量设计、在线优化及控制实现

换热网络全周期运行期间,由于设备老化等因素,换热性能逐步下降,能耗逐步提高。而当前工业换热网络的设计并没有有效地解决此问题。换热网络结垢老化是一个慢时变过程,相对于

学位

换热网络裕量设计在线优化控制实现

联机中文手写文本识别方法研究

随着手机、平板电脑、电子白板、数码笔等移动终端设备的进步和广泛应用,联机手写输入得到了越来越多的应用和关注,这些手写设备的应用也生成了大量的联机手写文档,对联机手

学位

联机手写数据库手写文本识别置信度转换手写句子实时识别

无线接入网络主动队列管理算法研究

近年来,随着无线技术的迅速发展,无线接入网络已应用到了人们日常生活的方方面面,但拥塞仍是影响网络全局性能的关键问题。如何避免网络拥塞,是无线接入网络目前的一个研究热

学位

无线接入网络拥塞控制主动队列管理队列缓存比神经网络模糊控制

基于脑机接口技术的手部运动康复研究

脑卒中(stroke)又叫脑中风,特指由于急性脑血管循环障碍引起的持续性(＞24h)大脑半球或脑干局灶性神经功能缺损,临床表现为外周神经坏死,容易造成患者各类偏瘫症状。据不完全统

学位

脑机接口技术隐马尔科夫模型脑电信号手部运动康复技术遗传算法Nao机器人

智能车辆换道轨迹规划及跟踪控制研究

车辆换道行为是很常见的一种交通现象,车辆换道会影响其它相关车辆的运行状态,智能车辆的换道行为应该以实际车辆的换道为原型,以智能车辆自身特点为基础进行研究。智能车辆

学位

智能车辆最小安全距离模型滑模变结构跟踪控制换道行为轨迹规划图像处理

基于嵌入式平台的无源红外路标定位系统研究

随着科技水平的进步和人们对生活品质的要求越来越高,室内移动机器人的应用领域越来越广泛。在自主移动机器人的研究领域中,机器人自定位是一个非常重要的研究方向,是实现机

学位

嵌入式平台无源红外路标定位系统工作原理补偿方法误差范围

估计和处理扩散磁共振成像中的总体平均扩散概率密度及其特征

通过对水分子扩散的建模,扩散磁共振成像(Diffusion MRI,dMRI)是唯一的活体非侵入地研究白质微结构的技术。总体平均扩散密度函数(Ensemble Average Propagator,EAP)和方向分

学位

扩散磁共振成像技术概率密度工作原理估计方法线性变换各向异性

基于潜在变量的图像理解研究

与本文相关的学术论文