论文部分内容阅读
目标识别检测作为图像分析与理解的基础,在计算机视觉领域中具有极为重要的地位也极具挑战。论文就基于卷积神经网络(Convolutional Neural Networks,CNN)的目标一体化识别、定位和检测展开研究,其目的在于通过深度学习网络将目标的识别、定位、检测有机结合,能在识别目标类别信息的同时定位目标位置,为机器进行场景的理解、态势感知以及目标行为的分析提供支撑。论文首先对基于传统方法的经典目标检测算法进行了总结分析,并对当前基于卷积神经网络的一系列目标检测算法的发展与演进进行分析比较,由此得知,基于卷积网络的系列目标检测算法得利于多层卷积网络的目标特征学习提取能力,具有极强的一般性和普遍适应性,能同时实现多类目标的识别检测,极大地推动了目标检测研究的发展。随着网络层数的增加,网络对目标语义特征表示能力增强,但同时也发现,随之带来目标位置信息模糊,这最终导致目标检测定位精度不高和小尺度目标检测的失效。针对检测精度和小尺度目标检测问题,本文提出了改进的基于端到端的目标检测算法。该算法采用网格划分的思想保持了端到端目标检测的快速性。在目标检测定位精度上,对现有网络所采用的不同目标函数与激活函数进行了分析比较,通过更为准确地定义目标函数,使其与位置信息更相关,并选取更契合的激活函数,从而实现目标检测定位精度的提高。在上述研究的基础上,研究提出了基于多尺度特征提取的目标检测算法。简单地将多层特征融合,将使得特征过于冗余反而降低识别准确性。依据多层网络中,目标语义特征表示能力随网络层增加而变化的特点,本文对各层的目标特征表示能力进行分析,从而提出了选择性的特征连接方式,在提升检测效果的同时使得特征的提取不过于冗余。另外,在某实际应用项目中红外行人小目标的检测中,针对目标特征不丰富、尺度小的问题,本文采用了数据增广和预处理的方式,丰富了训练数据,使得网络的训练更充分,提升了网络对于此类目标的检测能力。本文使用公开数据集对算法进行了测试,并且和拥有优秀检测效果的模型做出了对比。最后,对该算法进行了全面的分析和总结,并给出了该算法继续改进的思路。