基于显著性和模板匹配的复杂背景下目标检测算法

来源 :天津大学 | 被引量 : 0次 | 上传用户:feager2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
复杂背景下的目标检测是计算机视觉领域的核心问题之一,其主要任务是识别和定位图像中的目标。本文针对复杂背景下的目标检测提出结合显著性和模板匹配的算法。首先对图像做显著性预处理,然后在显著性区域内实现目标检测,最后对基于显著性和模板匹配的目标检测算法做实验分析。
  在显著性预处理过程中,首先提取图像的超像素特征向量,通过随机森林分类得到包含前景、背景和未知区域的初始显著性三元图,在三元图中完成显著性检测;然后根据本文提出的组合多种传统低维颜色特征的高维颜色特征概念,实现基于全局的显著性检测,还采取了基于相邻超像素特征的局部显著性检测算法。最后对两种显著性检测结果迭代优化组合,实现最佳显著性区域检测效果。
  本文提出一种基于形状特征的模板匹配算法在显著性区域中实现目标检测。首先采用新的形状描述子表征目标的轮廓形状,以此可以进行模板图像和待测图像之间的匹配;然后应用动态时间规整的匹配算法和深度优先的搜索策略得到目标检测的候选假设;最后进行假设验证,实现复杂背景下的目标检测。
  算法的实验分析包括显著性区域检测实验、最终的目标检测实验、显著性预处理和形状描述子的性能分析。在MSRA-B、ECSSD和PASCAL-S数据集中进行显著性检测实验,自适应阈值的算法检测准确率可以达到89.5%,比常见的GC和RBD模型都有明显提升,在保证检测率的同时,平均检测时间比DRFI模型减少79.5%;在ETHZ、INRIAHorse和Caltech101数据集中进行最终的目标检测实验,每张图像的平均误检率为0.3时,算法的平均检测率可达到98.4%;平均误检率为0.4时,检测率可以达到99.7%。与其他基于形状的目标算法相比均表现优异。最后在ETHZ数据集中对比分析是否应该进行显著性预处理的实验,证明显著性预处理的步骤是必要且有效的;同时在两个形状数据集MPEG-7和Kimias中对形状描述子做实验分析,对比常见的形状特征算法,该形状描述子在图像检索中的匹配得分和检索数目都具有最优表现。
其他文献
压缩感知(Compressive Sensing,CS)理论作为一种新的数据获取框架,其优势是从低维的观测值中重建高维的稀疏(或可压缩)数据,降低采样成本。观测矩阵与观测值的生成、数据重建精度密切相关,是CS理论的一个重要研究方面。经典随机矩阵的高计算复杂度和其随机结构与一些实际应用领域的不一致性,使得结构化观测矩阵的研究日益受到关注。尽管结构化观测矩阵的研究取得了一些成果,但在一些实际领域出现的
视频中的异常行为分析在交通监控、社会安防等领域有着广泛的应用,近年来已经成为计算机视觉研究的热点之一。本文针对视频中运动目标的轨迹信息提取和异常行为分析开展研究。运动物体的轨迹能够提供目标运动行为模式的宏观信息,而且与视频数据相比,轨迹信息易于储存、传输和分析,尤其适于交通场景下的长时间车辆监控。因此,本文以运动目标的轨迹作为行为的主要表征,研究异常行为分析的几个关键技术问题。一方面,研究用于视频
学位
合成孔径雷达(Synthetic Aperture Radar,SAR)遥感与光学遥感相比,能够全天时、全天候、全地域进行实时数据采集,成像效果不受时间、气候和地域的影响。同时,合成孔径雷达成像分辨率与目标距离无关,在国防和民生方面具有非常重要的作用。由于其相干成像机制,合成孔径雷达图像中不可避免地会产生斑点噪声。斑点噪声是一种依赖于观测信号的颗粒状噪声,是相干成像系统中固有的噪声,相干斑的存在降
随着对海洋资源环境越来越多地开发利用,人们对海洋信息的采集要求不断提高,测量船作为信息采集设备的主要载体,对其航行控制,尤其是航迹控制,也提出了更高的要求。自动舵是实现航迹保持的主要设备,在测量船航行过程中,由于受到海上环境的干扰,会偏离预先设定的航线,此时需要自动舵装置控制船舶改变航向,使船回到规定的航线上,这样测得的数据才是我们预期中想要得到的数据。  近年来,人工智能技术发展迅速,应用也越发
低频微振动在我们日常生活中、工业领域中随处可见,如生命体征监测、桥梁楼宇质检、地震监测等。但是,对低频微震动的测量参数获取比较复杂和困难,其被测对象形貌复杂,振动频率通常在几个赫兹范围,振动幅度在毫米,甚至亚毫米级别。因此,传统的接触式测量方法具有一定的局限性。为了实现快速、精确的全场振动测量,非接触式光学图像测量方法提供了一种合适的解决方案。非接触式光学图像测量方法是通过振动信号对图像特征点的像
学位
雾霾天气下拍摄的图像存在细节模糊、色彩偏移、低对比度等问题,严重影响户外视觉系统发挥效用。因此,雾霾图像清晰化研究具有重要的理论意义和应用价值。论文根据雾天图像成像特点,针对目前基于统计先验和基于学习方法去雾后图像易出现颜色失真、细节模糊及噪声放大等问题,提出了新的见解和方法。论文主要工作如下:  首先,为了避免图像去雾后细节模糊和噪声放大,将图像分解为结构层和纹理层,并只对其结构层进行去雾。基于
学位
随着计算机的普及和数字图像处理技术的进步,计算机视觉技术得到了飞速的发展,利用深度学习的方法进行目标检测与识别,较传统的目标检测与识别方法,实现了自动化、智能化和高效化,且具有更高的检测识别精度。  红外图像与可见光图像相比较而言,其抗干扰能力更强,红外图像的目标检测变得越来越重要,尤其是在军事领域和恶劣环境下。然而现如今,目标检测技术主要集中在可见光图像领域,可见光图像与红外图像成像原理不同,因
学位
目标检测是计算机视觉中最具挑战性的问题之一,其目的是检测图像中特定目标的位置,已广泛用于人脸识别、自动驾驶、行人检测、视频监控等领域。基于深度学习的方法由于其无需进行人工特征设计、具有良好的特征表达能力及优良的检测精度,成为当前目标检测算法的主流。针对特征金字塔网络易丢失细节和检测速度慢等问题,本文提出了高效轻量化特征金字塔网络及其目标检测算法。主要工作如下:  与基于图像金字塔的目标检测方法相比
学位
语音是人类传递信息最直接的方式。近年来,发声器官器质性或神经性的病变使得嗓音疾病发病率越来越高,嗓音含混不清会影响人们的沟通效率,采用非侵入式的信号处理方式对病理嗓音进行修复,能提高受损语音的可懂度,提高人们的沟通效率。此外,病理嗓音修复在语音识别、机器导航、语音增强、语音通信系统、军事刑侦和隐蔽监听等领域都有着很广泛的应用前景。本文以提高病理嗓音可懂度为目标,设计实现了一套完整的病理嗓音修复系统
随着计算机技术和计算机视觉的迅速发展,人脸表情识别算法在人机交互环节中充当着重要角色,有着非常广阔的应用前景。人脸表情识别算法可以统计学生在课堂上的听课状态、记录司机在驾驶过程中的疲劳程度、捕获危险分子在公共场所的异常表情避免不必要的事故等等。提高人脸表情识别算法的准确率是人脸表情识别领域的重要任务。  选择合适的网络结构和损失函数对于提高基于卷积神经网络的人脸表情识别算法的准确率至关重要。人脸表