基于视觉结构表达与建模的物体检测研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:bxz231
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
物体检测是计算机视觉领域最基础的研究问题之一,并直接影响着计算机视觉的很多其他问题如物体跟踪、行为识别、场景理解等。它在视频监控,生物特征识别,人机交互,多媒体检索,计算广告,无人车等很多领域都有着广泛的应用。虽然针对该问题的研究工作已经有许多,但物体检测至今仍然是一个非常难的课题,其中最难的是如何得到鲁棒的物体表达。本文从视觉结构表达与建模的角度对这一问题进行了研究,开展了以下工作:   1)通过对已有工作以及人们已有的关于结构的概念认识进行归纳总结,本文给出了视觉结构的准确定义,更进一步的,本文讨论了如何进行视觉结构表达与建模的一些思考和技术路线。   2)从信号处理、尺度空间理论以及过去成功的案例中总结受到启发,构建出局部特征化描述子,最后提出基于提升算法(Boosting)的局部结构化描述子的特征融合方案并纳入到拓扑星座结构模型。该方法在2010年的PASCAL VOC竞赛中取得了冠军成绩,代表着该领域的国际领先水平。   3)为在拓扑模型层面提供更加灵活的结构描述能力,本文提出了面向部件模型的空间混合结构模型。首先为削减模型复杂度,提出了面向部件模型的数据降解算法,然后在此之上提出了空间混合结构建模算法,增强了模型对视角变化、姿态变化的鲁棒性。在2011年的PASCAL VOC竞赛中该方法获得了检测任务冠军,再次强有力的证明了该方法的有效性和领先地位。   4)前面几项工作都是在结构拓扑已知的情况下进行的,而本文的最终目的是进行结构拓扑的自动学习,因此本文最后提出基于数据驱动的物体结构学习算法框架。实验结果表明提出的自动结构学习可以有效的克服遮挡、形变、背景等干扰。   5)通过量化分析之前提出方法的结果,本文发现这些系统的召回率较低,而事实上是存在巨大潜力能够提升召回率的。基于此,本文提出了一种有效的基于学习的端到端的语义窗口挖掘系统,提高了系统召回率并一定程度提高了系统的准确度。本文的算法是从结构化建模方法出发,最终导出适合语义窗口挖掘的模型和范式。从这个角度来讲,本章的算法也是基于结构化信息建模在后处理中的应用探索。   6)物体检测是计算机视觉研究的最基础问题,也是最有应用潜力的问题。我们在一个国际合作项目中,深入探索了物体检测(包括运动物体检测和静态物体检测)在面向家居安全的智能视频分析中的应用,实现了相关技术转移。在平台应用中,本文创新的提出了基于历史模式的运动物体分析以及基于场景结构学习的快速行人检测算法,在家居环境中该算法很大程度上提高了系统的鲁棒性和可靠性。
其他文献
飞行器地面仿真与测试技术,是支撑现代航空工业发展的基础技术之一,它贯穿于现代航空产品的设计、研制试验、生产制造、试飞验证和保障维护全寿命过程,而其中飞控系统的地面仿真
问题解决是寻求某一问题的初始状态与目标状态之间的路径。学习过程是一个不断提高问题解决效率的过程,因此,如何表征问题并找到最有效的问题解决的策略是学习的重要目标。与以
地下埋管换热器是土壤源热泵系统的重要组成部分,它与周围土壤之间的传热是一个复杂的、非稳态的传热过程,是土壤源热泵技术的关键。但是在地埋管设计上,工程上经常采用“单位延
深空探测是继卫星应用、载人航天之后的重要航天技术领域,而小行星深空探测作为空间探测活动新的发展方向,已成为21世纪深空探测的重要内容之一。论文以精确着陆小行星的探测任
本课题对驱动游梁式抽油机的无刷直流电机(Brushless DC Motor,简称BLDCM)的控制方法进行了研究,并制作了相应的无刷直流电机控制系统。随着电力电子及集成控制技术的发展,电子元器件性能更好,成本更低,使得机电一体化的高技术产物——无刷直流电机拥有着广阔的应用前景。它具有功率和转矩密度高,系统效率大于90%,起动转矩大,中低速转矩特性好,十分适合用来驱动抽油机,因此成为本课题的研究对
糖尿病视网膜病变是糖尿病的严重并发症,是目前严重的致盲眼病。早发现,早诊断,早治疗,则可抑制病情的发展以利于治愈。视网膜图像的普查已成为早发现的重要手段,对视网膜图像的分
归纳推理(inductive reasoning)是由已知事实向未知进行扩展推论的过程,旨在将知识或经验概括简约化,是人类高级认知活动中的重要组成部分。标签效应是归纳推理中重要的心理学
光学投影断层成像(OPT)技术利用可见光在小尺寸生物中沿直线传播的特点,发射光束穿透样本得到投影图,进行解剖结构三维成像(透射式OPT),类似于X光CT;或者利用特定波长的光束激发
类别概念的提取是人类信息提取中最基本的认知功能之一,也是人类进行其它高级认知活动(学习、问题解决等)的基础。根据其信息的抽象性,类别概念通常可以分为三个水平:一般水平、
异步启动永磁同步电机没有励磁损耗,其效率、功率因数都比三项异步电机高,并且可以利用变频器方便地调节同步转速,因此使用广泛。   本文针对异步启动的永磁同步电机的多目标