复杂场景下的目标检测技术研究

来源 :电子科技大学 | 被引量 : 2次 | 上传用户:pengdou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
复杂场景下的目标检测是一个极具挑战性的任务。一方面,光照在强度、角度、距离上的变化与观察者在观察位置、角度、距离上的变化带来背景与目标的各种复杂变化,比如亮度、对比度、阴影、位置、尺度、视角、姿态等变化;另一方面,3D到2D的成像过程中引入的噪声、造成的信息缺失使得问题更加复杂化甚至变得无法求解。本文围绕复杂场景下的目标检测这一任务开展了系统性的研究工作,涉及到的内容包括:视觉研究的方法论基础,单帧上的2D目标检测(包括视觉词袋模型、Pictorial模型),连续帧上的2D目标检测(朴素贝叶斯模型)。本文的研究工作既注重理论与方法的思考,也注重算法设计与实现的研究。具体的内容简述如下:1.本文在Marr的视觉表示理论的基础上,结合统计学习理论,总结出了视觉模型方法,即视觉约束的统计学习方法。该方法具有两个重要特点:既注重计算的研究又注重物理约束的研究;强调视觉计算从本质上讲是一个概率推断过程。该方法将解决一个具体的视觉问题归纳为五个步骤,其中,前两个步骤对应计算理论层次,后三个步骤对应算法设计层次。该方法是贯穿本文的方法论基础,对本文研究工作的开展具有基础性的指导作用。2.本文采用视觉模型方法,对具有仿生特点的分层最大化模型(HMAX)进行了计算理论层次与算法设计层次上的分析,指出其本质上就是视觉词袋模型。基于此分析,本文对分层最大化模型进行了两方面的发展:首先,针对该模型采用的随机视觉单词选取方式存在的误选、低效等问题,将自下而上的视觉注意力约束引入到视觉单词的选取过程中,有效提升了视觉单词选取的有效性与效率,从而有效提升了目标检测的性能;其次,针对视觉词袋模型缺乏对目标几何结构信息进行描述的问题,将分层最大化模型与显式的形状匹配模型结合起来,提出了可区分的形状模型。从计算理论层次上讲,可区分的形状模型引入了一种额外的约束——目标的形状约束。实验表明,目标的形状约束对于提升目标的检测性能是有效的。3、本文采用视觉模型方法,对Pictorial模型与受约束的Pictorial模型进行了计算理论层次与算法设计层次上的分析。针对受约束Pictorial模型的一种设计——星形的形变部件模型(DPM),本文首先注意到了其采用的基于梯度原子原语的HOG特征仍有较大的提升空间,因此本文基于Gabor原子原语提出了一种具有仿生特点的底层特征HOGabor。在PASCAL VOC 2007等数据集上的实验表明,该特征能够显著的提高刚性目标(如飞机、小车等)的检测性能。本文在多个数据集上对形变部件模型进行了全面的评估,并从统计学习理论的角度分析了样本、模型复杂度、模型推广能力之间的关系,对进一步的研究工作具有重要的指导意义。4.针对受约束Pictorial模型的另一种设计——树形的姿态估计模型(POSE),本文指出了其存在的三方面问题:部件的联合分布问题,尺度估计问题和计算效率问题。针对这些问题,本文提出了计算目标最大后验概率(MAP)、基于根部件进行姿态搜索两种改进方案。实验表明,这两种改进方案能够有效提高人体姿态估计的性能与效率。5.对于连续视觉输入,本文基于离线学习的目标先验与在线学习的目标偏置显著性似然,建立了一个实际的视觉贝叶斯模型。该模型采用特征条件独立假设,可以基于同样的底层特征——Gabor原子原语。该模型不同于已有的概念性的或者面向特定用途的视觉贝叶斯模型,很好的展现了在连续视觉输入上统计学习问题的有效简化,展现了自上而下与自下而上两个视觉过程的交互,展现了由粗到细的目标检测过程。整体上看,本文首先总结了视觉研究的方法论基础:视觉模型方法;然后在其指导下主要对三类2D目标检测模型进行了系统性的、理论与实践并重的探讨;在此基础上,本文从多个层面、多个角度对这些2D目标检测模型进行了发展、提升、改进与再创造,一些工作已经具备了潜在的工程应用价值,另一些工作则在理论与方法层面具有一定的学术价值。从相互之间关系来看,这些2D目标检测模型在计算理论层次上存在由简单到复杂的递进关系,而在算法设计层次上则存在两个基本特点:输入由单帧走向连续帧、输出由粗(目标的矩形框)到细(目标的形状、目标的部件)。值得特别注意的是,本文已经得到了由粗到细的2D目标表示,这为走向分层的3D目标表示奠定了坚实的基础。
其他文献
美国是一个空间科学大国,保持在空间科学技术上的领导地位是美国空间科学和技术发展的基本方针.国际合作是美国空间科学活动的重要组成部分.多年来,美国在空间科学领域的国际
久居喧嚣绕耳、红尘缠身的都市,灵魂深处就会产生种强烈的欲望,那就是去登山、去探奇,洗亮蒙尘已久的双眼,梳理纷乱繁芜的心情。
对新药研发各个阶段改盐的典型案例进行分析,归纳总结新药改盐工作的评价思路,讨论目前对于新药改盐工作的考虑重点。
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
会议
目的:探讨老年股骨粗隆间骨折动力髋螺钉内固定手术护理配合技术,以提高手术配合质量。方法:分析、总结60例手术护理配合经验,分别从巡回、器械护士配合内容作详细汇报,并对术
王实甫的《西厢记》是中国古典文化经典之作,他宣扬了“永老无别离,万古常完聚,愿普天下有情的都成了眷属”这一主题。许译《西厢记》是许渊冲教授翻译功力达到炉火纯青境界
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
截至5月28日,管道设计院承担的中国首条山地在役中缅管道数字化恢复测绘工作,管道线路测量沿线基准点完成100%,怒江、澜沧江、漾濞江3处大型跨越的三维扫描完成,管道本体探测
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
包围地球的空气被称为大气.像鱼类生活在水中一样,我们人类生活在地球大气的底部,并且一刻也离不开大气.大气为地球生命的繁衍、人类的发展,提供了理想的环境.它的状态和变化