论文部分内容阅读
在计算机视觉领域中,深度学习在目标检测任务上的性能已经超越以往,达到了历史最高水平。本文主要研究的课题就是目标检测问题在商标领域上的应用。不同于开放领域的目标检测任务,商标检测任务存在着目标尺度跨度大、场景变化复杂、目标旋转形变严重以及小目标数目众多等特点,而目前主流的目标识别算法在针对商标领域的识别任务时准确率并不高。基于上述背景,本论文主要内容是目标检测算法在商标检测领域的研究。针对商标数据集中存在的目标较小、遮挡和旋转等问题,本文提出了一种基于多尺度图像模板的候选区域生成算法。算法主要思想是基于原始候选框生成网络框架,将图像金字塔和多尺度图像模板结合到统一网络中,同时将特征提前网络由原来的使用最后一层特征改为特征金字塔网络,提高了算法对小目标的检测能力。针对不同分辨率图像,算法使用不同大小尺度的图像模板,既解决了多尺度检测的问题,也没有过多的冗余计算。通过在公开数据集和人工标注的汽车领域数据集CarLogos上的对比实验,证明我们的算法优于原始候选框提取算法以及Selective Search算法。由于前文提出的候选区域生成算法无法输入多尺度图像,使得算法无法统一到原始Faster R-CNN框架,本文引入全卷积神经网络思想,利用1*1卷积核大小的卷积层代替原来的全连接层,提出了一种基于全卷积神经网络的商标检测算法。算法基于Faster R-CNN框架,将全卷积神经网络和基于多尺度图像模板的候选区域生成算法相结合,整合统一网络中测试和训练。经过实验分析,该算法在FlickrLogos数据集和CarLogos数据集上的mAP值均优于原始Faster R-CNN算法以及其他若干主流目标检测算法。针对目前商标检测数据集中存在的数据集类别较少、场景单一等问题,本文还提供了一个针对汽车领域的商标数据集。本文利用网络爬虫,爬取了大量自然场景下汽车领域商标图片,并进行了人工标注。该数据集类别众多,每个类别标注数目可观,可以有效地丰富商标检测数据集。