论文部分内容阅读
在计算机视觉(Computer Vision,CV)研究领域,如何基于某种可计算的理论模型,使机器视觉能够同人类一样,完成自主感知、显著目标检测、持续跟踪的任务,是CV领域无数学者为之努力的目标。虽然现阶段的生物学、神经科学、心理学等领域对人类大脑和视觉的底层工作原理还不完全清楚,但这并不妨碍学者们提出各种计算模型来完成机器的显著目标性检测(Salient ObjectDetection,SOD)以及视觉目标跟踪(Visual Object Tracking,VOT)任务。 本文研究重点正是CV领域中SOD和VOT这两个子方向。总体来说,基于前辈学者们优秀研究成果的基础上,本文主要对SOD和VOT领域做出三个贡献: (ⅰ)本文在贝叶斯框架下,将人类视觉注意力理论中Bottom-Up模式被动感知与Top-Down模式主动检测,按照时间先后顺序结合在一起,给出一种能够由粗到精逐步感知和获取视场中视觉显著性目标位置及尺度的实时SOD算法,我们称其为基于贝叶斯框架的显著目标检测,通过在微软MSRA数据集上进行ROC和Precision-Recall测试,证明本文算法可取得比目前经典算法更好的结果。 (ⅱ)本文提出了一种改进的MeanShift目标跟踪算法,此算法基于贝叶斯最小分类误差决策将特征空间划分为两个子集,并将目标特征子空间向图像平面坐标空间映射,从而得到目标像素空间分布,再基于此分布自适应更新目标尺度和核函数带宽,以便更加准确的通过MeanShift迭代估计目标状态,本文将此改进算法命名为基于贝叶斯决策的尺度自适应Mean Shift(Bayes-based Adaptive-scaleMean Shift,BAMShift)跟踪算法,实验分析证明BMAShift算法在位置准确性(Position Accuracy)和重叠率(Overlap)上与5种经典跟踪算法相比,均有有更好表现。 (ⅲ)本文证明了嵌入盒子滤波(Boxing-Filter)的改进NCC匹配跟踪算法(NCC-BF)在遍历式匹配(Exhausiting Match)跟踪过程中仍有冗余计算量存在,本文定量给出了此冗余部分的表达式,并定义了一个能让匹配提前终止的判决条件(Early Termination Condition,ETC),并证明一旦满足ETC则可立即停止匹配,从而进一步减少了冗余计算。本文将这种改进算法称为基于提前终止判决的归一化互相关算法(Normalized Cross Correlation based on Early TerminationCondition,NCC-ETC),实验证明NCC-ETC算法相对于传统算法有着更快的速度和相同的全局极值收敛性。