【摘 要】
:
目标检测作为计算机视觉领域的基本问题之一,得到了越来越多的关注。它是从图像处理到图像理解之间的关键步骤,其主要目的是为了从图像中识别出待检测目标,完成场景理解或行为分析的第一步,因而被广泛地应用到各个重要领域,如视频监控、智能交通、生物特征识别等。然而,目标检测技术依旧有很大的上升空间。针对实际场景中目标尺度大范围的变化,单一尺度的检测方法很难平衡虚检和漏检的问题。传统目标检测技术的处理方式就是采
论文部分内容阅读
目标检测作为计算机视觉领域的基本问题之一,得到了越来越多的关注。它是从图像处理到图像理解之间的关键步骤,其主要目的是为了从图像中识别出待检测目标,完成场景理解或行为分析的第一步,因而被广泛地应用到各个重要领域,如视频监控、智能交通、生物特征识别等。然而,目标检测技术依旧有很大的上升空间。针对实际场景中目标尺度大范围的变化,单一尺度的检测方法很难平衡虚检和漏检的问题。传统目标检测技术的处理方式就是采用图像金字塔,通常会导致检测效率受限。同时,大多数检测算法都关注在目标的定位问题上,而在一些应用场景中,比如图像分割、运动目标姿态识别等,通常需要的不仅仅只是一个包围盒(Bounding box),还需要更多目标的描述信息或者姿态信息。此外,伴随着深度神经网络的研究热潮,也给目标检测领域带来了诸如训练样本需求量大、训练时间过长等问题。以卷积神经网络为例,该网络模型往往需要至少数以万计的训练样本和十几个小时的训练时间。这些问题都在一定程度上阻碍了相关理论算法的进一步应用。针对上述问题,本文对原始的活动基模型(Active Basis Model,ABM)加以改进,提出了基于多层网络结构的目标草图检测模型。活动基模型的学习阶段只需少量的训练样本,而且对目标具有良好的描述性能,有利于对图像进行理解。但它解决的仅是目标的定位和描述问题,且该模型的训练是一个前向挑选的过程,通过生成一组Gabor字典集,接着进行图像卷积将训练样本投影到这组Gabor集构成的空间,用少量经过最大值池化的Gabor基对图像进行稀疏编码,得到初步的检测模型。本文在该模型的基础上引入了分类的概念,将单目标描述问题优化为多目标的检测问题,同时扩展的多尺度结构模型有效地避免了图像金字塔带来的时间损耗。此外,本文改进了投影次梯度算法(Primal Estimated sub-GrAdient SOlver for SVM,Pegasos),通过选取一组样本集迭代进行模型参数优化和困难样本挖掘,以完成对模型的误差反向传播训练,使得最终的模型不仅获得了更高的检测效率,而且具有了更鲁棒的检测性能。本文的算法以Matlab和C++混合编程实现,并在实验室自建的葡萄数据集和公共的MIT行人数据集上进行了测试,实验结果表明,本文模型在检测效率和准确率上都明显超过了原始活动基模型,证实了本文方法的可行性和有效性。
其他文献
基于表面等离子体共振的光纤传感器是一种新兴的传感器,其具有高灵敏度、高分辨率、响应速度快、抗干扰能力强等优点,在环境监测、生物医学等领域具有很广泛的应用前景。本文
随着计算机网络,通信技术和电子技术的快速发展,信息传播已经取得迅猛的发展。其中数字图像和视频作为信息的主要载体,是人类获取和交换信息的主要来源。数字图像的相关研究
电容层析成像(Electrical Capacitance Tomography,ECT)技术是自20世纪80年代借鉴医学CT技术发展起来的一种成本低廉且安全性能高的新型流动层析成像技术。它可以在不破坏封
无线可充电传感器网络(Wireless Rechargeable Sensor Networks,WRSNs)中,如何设计合理的路由协议,关系到节点能量动态平衡以及数据传输路径稳定性,进而影响网络的生命周期。
随着互联网信息技术的发展,各种网络服务层出不穷,使得互联网体系结构中的僵化问题日益严重。网络虚拟化技术可以使得在不改变底层物理网络架构的情况下,让多重异构的虚拟网络成为可能,现已成为解决未来网络架构的重要因素。作为网络虚拟化技术的关键,近年来对基本网络切片问题即单域虚拟网络映射问题的研究已取得了一些瞩目的成果,但随着网络服务的更新换代,单域网络片逐渐无法应对人们的需要。底层跨越多个自治域的网络切片
随着大数据技术的快速发展,用户拥有的数据量越来越大,这些海量的数据可能会超出个人用户所拥有的存储能力,导致用户难以实现将海量数据完全存储到本地这一目标。在这种背景
内生经济增长理论认为,创新是经济增长的内在源泉和不竭动力。近年来,以资本要素投入、资源环境消耗为代价的经济发展方式已经无法满足我国经济持续健康发展的需求。优化经济
在机械制造的自动化背景下,轴类零件安装间隙的快速重复检测是机械行业内的一类重要研究课题。目前,国内大多数企业对于轴类零件安装间隙的检测主要依赖人工完成,人工检测成
随着高性能计算在科学研究和海量数据处理中广泛应用,对高性能计算软件环境的完善成为了人们关注的焦点。编译技术作为软件和硬件连接的桥梁,对高效的编译技术的研究越来越受
由于陆地资源在不断枯竭,许多国家将目光转移到具有丰富矿产资源、渔业资源的海洋。智能水下机器人可自主实施水下环境中海洋资源的开采,避免人工水下作业带来的安全风险,而