论文部分内容阅读
近年来,多视角目标类检测在计算机视觉和多媒体领域受到了越来越多的关注,而检测的对象也由多视角人脸和行人扩展到一般的多视角目标。该研究中最具挑战的问题之一是如何检测任意视角的目标类别。同类目标不同实例之间颜色、纹理等外观信息差别很大,而且由于多视角的影响,不同视角之间的同类类目标差别也很大,因此,解决该类问题必须同时处理类内外观和观察视角变化的双重影响。目前,对同类目标外观的建模已有很多高效的算法,但对不同视角的同类目标间的视觉建模目前还缺乏研究,其主要原因是同类目标的不同视角之间底层特征较难找到有效关联,导致了相关算法的不精确性。同时考虑目标外观和多视角因素来建立多视角目标检测的算法模型更具挑战性。本文就多视角目标类检测算法进行了深入的研究,针对多视角目标类之间的关联提出了两种可能的解决途径。第一,针对目标的不同视角训练独立的分类器,用于该视角下的目标检测,利用视角之间的位置关系将这些独立的分类器对应到视角球面之上,之后通过将视角球面三角化从而建立视角分类器之间的关系,在检测阶段通过三角融合各个分类器的输出给出最终的检测结果;第二,为目标的不同视角建立可用于检测的视觉码本,视觉码本包含目标中存在显著轮廓或形状信息的局部结构,之后通过关联不同视角间的相似的局部结构从而建立视觉码本间的关联,形成用于描述目标任意视角的多视角码本,可用于任意视角的目标检测与视角估计等任务。两种方法都在公共数据集上验证了方法的有效性,和当前的其它方法做了对比。本文的主要贡献如下:1.针对多视角目标检测中的融合多分类器方法,提出了一种基于视角球面的三角化融合机制,通过不同视角的分类器完整覆盖整个视角球面,从而达到检测任意视角目标的目的;2.利用树结构来组织目标类的视觉码本,树的构建过程即是码本的生成过程,而树结构能有效减少了码本匹配时的计算量和计算时间。检测的过程通过匹配的码本入口的霍夫投票得到霍夫图像,霍夫图像中的局部极大值就对应着目标出现的位置。3.通过低层特征的关联建立不同视角之间视觉码本的关联,将多个视角的信息在更早的阶段关联起来,形成描述多视角物体的多视角码本结构。