目标检测若干关键技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:zhumuray
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测是计算机视觉中的核心任务之一。目标检测是指提取图片的颜色、纹理、形状、边缘、梯度等底层视觉特征,建立目标表示模型,然后采用机器学习和模式分类的方法实现图像中目标的检测。目标检测研究图像中目标的检测定位。这是对图像做出进一步理解的基本前提。同时,目标检测也是其它计算机高层语义理解任务的基础之一,比如基于检测的跟踪。除此之外,目标检测与其他学科也有着紧密的联系,如在多媒体领域的基于内容的图像检索,又如对智能视频监控、信息安全领域都有着重要的应用价值。   关于目标检测的研究,一般涉及三个方面:合适的特征描述,恰当的目标模型,有效的检测算法。本文针对图像中的目标检测进行了比较深入的研究和探讨。本论文的主要工作和贡献体现在以下几个方面:   ①提出了提升森林方法,结合HOG特征来进行人体检测,以及结合LBP特征检测摩托车。该方法将随机决策树作为弱分类器,嵌入到Adaboost的框架中。以此方式,随机树动态的组合成一个强分类器:提升森林。提升的过程避免了典型的随机森林算法中选择的盲目性和随意性,同时也评估和选择潜在的特征。此外,随机树的节点分裂后,其子节点的训练样本减少,而特征维度未减。这就给子节点(尤其是靠近叶节点的分裂节点)的学习带来难度。于是,我们提出了基于核的随机森林的学习方法,解决了较少样本的分类问题,并将融合到提升森林的目标检测框架里。我们在公开数据库PASCALVOC2008数据库上的实验结果验证了该方法的有效性和准确性。   ②提出了基于层级的模板匹配方法。具体而言,我们提出了三级的模板匹配方法。首先采用改进的主方向模板(dominant orientation template,DOT)对尺度和旋转匹配以进行粗过滤。其次基于金字塔局部三元模式(pyramid local ternary pattern,LTP)利用纹理特征以进一步过滤。最后训练了一个分类器对表观特征分类以做最后辨别。该层级模板匹配方法同传统的模板匹配方法相比能提供较低的虚警率,同SIFT相比能较大减少匹配时间而表现性能相当;而同DOT相比,以运算时间略微增加的代价获得了虚警率较大降低。我们的实验表明了提出的该方法在YouTube视频上若干实例检测任务上的有效性。   ③为了处理多目标的实例检测,本文提出了层次化的框架和点对的分类方法。首先,在模板图片对齐之后,标志性的模板被选出来替换原始模板,并用于主方向特征寻找匹配响应。然后,通过一个点对的二元分类器来过滤这些响应。点对分类器的目的是判断匹配响应和模板是否属于同一个实例,这就将多实例检测问题转化成一个二元分类问题,解决了多类目标检测问题中正样本十分有限的情况。实验表明我们的方法比传统的多目标分类器组合和DOT方法有更低的虚警率。   ④设计和实现了两个目标检测的应用原型系统。一个是实时的多实例检测系统,另一个是深度图像上的人体部件检测系统。多实例检测系统,通过模板匹配和点对分类的二级结构框架,实现了实时的多类目标实例检测。深度图像的检测系统,利用以头肩检测为基础的部件组合模型,利用协方差矩阵特征以多实例算法训练模型减小人工标注的强度和标注误差带来的风险。
其他文献
近年来,能源和原材料费用的增长、市场需求的变化、产品质量和结构的改进以及环境保护的全球化趋势,使人们越来越重视能源的节省和经济效益的提高。效率的提高对过程控制系统提
该文主要介绍了系统视觉处理系统所进行的工作,主要包括如何利用计算机视觉技术,求解出车道轨迹和障碍物位置信息,以便专家系统进行控制决策.该文在深入分析比较各种常用的图
该文在分析和研究现有开关磁阻电机调速系统(SRD)控制器的基础上,对高性能数字化SRD控制器的设计与实现进行了深入研究与探讨.全文内容分为五个部分.第一部分对SRD的研究与发
该论文第一章讲述了无绝缘轨道电路产生原因.第二章对键控移频信号的频谱特性进行了详细分析,为后面系统方案的制定奠定了理论基础.第三章介绍了无绝缘轨道电路的原理和类型
该文研究了模糊神经网络及其在自动控制中的应用、模糊系统的状态反馈控制以及非线性系统的自适应模糊控制.
Mobile Agent是一种新型的分布计算技术.该文系统地阐述了Mobile Agent的定义、MA技术的优势、应用领域及远程计算、按需代码等进行比较,进一步分析了MA技术的优势.Internet
基础研究是知识生产和科技发展的源头,对推动科技的创新和社会经济的发展具有非常重要的作用.在知识经济的背景下,知识成为经济发展的核心要素,基础研究则成为各国在科技领域
现代影像技术的产生为人类认识并改造自身提供了新的途径,随之而来的各种围绕此技术的分析处理需求为研究工作者提供了新的机遇和挑战。基于医学磁共振图像的分割与分类算法在
该文拟在现代企业CIMS网络集成先进的通信技术,研究利用光纤同轴电缆方案,实现企业综合信息网.混合光纤/同轴HFC网是一种刚刚兴起的宽带通信体制,代表了一种宽带通信的新途径
现代流程工业具有大型化、连续化、智能化、重载化、高速化等特点,一旦故障发生,将会造成人员和财产的巨大损失,所以将故障诊断方法做为研究课题,具有重要意义和实际价值。针