论文部分内容阅读
一般物体生成器,又称为似物性检测,在加速物体检测与提升识别精度上有着极其重要的作用。它能够确定物体在图像中的可能位置,缩小传统滑动窗口方法的搜索范围,提高后续识别效率,所以一般物体生成器在图像识别中有着极其广泛的应用。然而,现阶段大部分一般物体生成器存在耗时较长,定位偏差大等问题,一定情况下无法满足实时处理的要求。因此,本文进行了超像素横跨级联多阈值扩展的实时一般物体生成器研究。首先,本文采用两种一般物体生成器BING和Edge Boxes来产生初始窗口集。仿真实验表明了 BING和Edge Boxes具有较快的计算速度,并在较低定位标准下有较高的查全率,较之于统计分布生成的窗口集,具有针对性高,定位偏差小的特点。然后,针对基于图论的超像素分割方法存在参数设置、计算效率低和分割效果不佳等问题,本文首次将自适应阈值的SLICO方法应用于一般物体生成器。实验验证了该方法能产生自适应阈值进行超像素分割,且在较快的处理速度下有更优的分割效果,很好地解决了上述的问题,为本文后续提出的方法,在利用超像素线索方面做出了贡献。其次,针对单层多阈值扩展(MTSE)方法易陷入局部最优的问题,本文提出了级联多阈值扩展方法,该方法包括了窗口聚焦校准和级联扩展两个部分。首先进行窗口聚焦校准,即将初始生成器所生成的窗口聚焦校准于目标主体,然后通过全局搜索和窗口多样化来进行级联扩展,提升窗口集定位精度,一定程度上优化了 MTSE。实验结果表明级联多阈值扩展方法能有效地提升窗口定位精度。最后,利用窗口打分和筛选机制对级联多阈值扩展所产生的窗口进一步筛选,提升了采样窗口集的整体质量。接着,基于BING和Edge Boxes提出了两种新的一般物体生成器SCM-BING和SCM-EB。在BING和Edge Boxes所产生的初始窗口集的基础上,首先采用SLICO对LAB颜色空间的图像进行超像素分割,然后通过级联多阈值扩展方法,窗口打分、筛选和采样得到最后的窗口集。通过在PASCAL VOC 2007数据集上与7种一般物体生成器对比实验,结果表明SCM-BING和SCM-EB以极少的时间损耗代价得到了更高质量的窗口集,一定程度上实现了精度和时间上的平衡,可应用于实时物体检测识别等环境中。