论文部分内容阅读
目标检测是计算机视觉领域中的重要基础研究,是关于物体分类和定位两个任务的技术,是图像内容理解等问题的重要基础技术。根据目标检测的技术流程,分别对区域推荐、特征提取和目标定位中存在的问题,提出了相应的改进方案。具体研究内容如下:1)针对Faster R-CNN算法中提取的候选框不具有显著性的问题,提出了基于注意区域推荐网络的目标检测模型。设计了注意区域推荐网络,通过注意模型计算特征图的权重值,增强显著的特征,削弱背景干扰。将注意区域推荐网络和目标检测网络联合训练,获得了基于注意区域推荐网络的目标检测模型。实验表明,基于注意区域推荐网络的目标检测模型在没有明显增加检测时长的情况下提高了显著物体的检测准确度。2)针对目标检测中存在的定位信息不足的问题,设计了一种融合深度语义信息的目标检测模型。将目标检测模型和深度语义分割模型进行融合,以获取包含目标分类信息和语义定位信息的融合特征。实验证明,本文提出的融合深度语义信息的目标检测模型提高了目标检测的准确率。3)针对目标检测模型中的定位精度问题,设计了目标定位优化网络来更好地拟合候选边框和预测边框的映射关系。然后,扩大初始候选边框为搜索区域,并将其划分为多个感兴趣区域送入目标定位优化网络。通过单独输入一个区域和多个不同区域的组合特征,对目标定位优化网络进行训练和测试。实验证明,提出的目标定位优化网络对目标检测效果有很大的提升。扩大候选边框为搜索区域和使用多种不同的输入区域都帮助网络更好地定位目标物体,使得检测结果的位置更加精确。