论文部分内容阅读
图像目标检测是计算机视觉领域中重要的研究课题,是日益增多的各类智能系统中重要的组成部分。以往机械式的目标检测算法仅适用于特定条件下特定目标的检测,且检测准确性易受干扰,算法通用性差。虽然智能式的目标检测算法在通用性上取得了较大进步,但该类算法的核心是图像识别算法,而各类图像识别算法只针对图像识别问题,对图像中目标的平移变换位敏信息不敏感,导致智能式检测算法对目标的检测不精确。同时智能式的目标检测算法在模型训练阶段,易受不平衡数据的影响,使得模型检测准确性降低。本文针对智能式目标检测算法对目标位敏信息学习不足问题,以及不平衡数据影响问题,提出了组合不同分割程度位敏信息网络的深度位敏网络结构,并结合该网络结构特点设计了基于集成学习思想的训练方式。通过修改深度残差网络获取图像深层特征,并在其后缀候选区域提取网络和组合的不同分割程度的位敏信息网络,利用候选区域网络,Selective Search和Edge Box提取目标候选区域,然后使用不同分割程度的位敏信息网络计算目标的位敏特征,使用位敏得分网络统计每个候选区域为目标区域的概率,最终输出该目标的位置和类别。基于集成学习思想通过共享网络权重的机制,设置查找困难样本的阈值不断更新训练集,循环训练网络以降低不平衡数据的影响,同时提高对困难样本的识别完成深度位敏网络的训练。实验结果表明,不同分割程度的位敏信息网络获取目标位敏的粒度不同使得检测结果存在差异,在VOC 2007测试集上2*2分割的准确率为66.2%,7*7的准确率为72.13%,本文的深度位敏信息网络通过组合不同分割程度的位敏信息网络实现位敏信息粒度互补提高了检测准确率,其中3*3与7*7组合的位敏信息网络在使用集成训练方式后准确率达到了 74.69%。