论文部分内容阅读
正所谓“工欲善其事必先利其器”。在互联网技术和计算机技术的飞速发展的支撑下,图像识别与分类技术也得到了迅猛的发展,一般级别的图像分类已经满足不了人们的需求,分类任务由以前的对动物、花鸟、汽车等基本类别简单的粗分类发展为对这个基本类别的子类的细分类。细粒度图像识别和分类的主要任务是对一些基类的子类进行更细致的划分,细粒度图像分类的难点在于与基类相比,子类之间的差异更不明显且更加细微,但是细粒度物体分类对当今社会的生产和生活来说是很有帮助的。因此,如何获得满意的细粒度分类准确度是计算机视觉领域一个高度关注的问题。细粒度图像识别与分类算法发展至今大致形成了两种主要的分类方法,一种是基于部件模型的细粒度分类方法,另一种是基于深度卷积神经网络的细粒度分类方法。本文基于这两种方法设计和实现了基于鉴别三元组模型的细粒度图像识别与分类算法和基于B-CNN模型的细粒度图像识别与分类算法。1.提出了基于鉴别三元组模型的细粒度图像识别与分类算法。首先利用最近邻算法对种子图像构造多组粗略对齐的图像集,然后以滑动窗口的形式对图像进行分割得到差异分值图,根据差异分值图定位到潜在的差异区域作为辨别斑块,基于几何约束选择分值最高的6个斑块随机构造候选三元组。与此同时,基于差异分值地图提出一种区域建议书方法可以非常有效的定位到待识别的物体。最后串联被选择的候选三元组的最大响应和目标对象的整体特征来构造中层图像描述,送入到SVM分类器或GoogLeNet进行训练。2.提出了基于B-CNN模型的细粒度图像识别与分类算法。由于弱监督训练模型可以大大减少手工标注的工作量,一直以来也是细粒度图像识别与分类的发展的主要方向。基于B-CNN模型的细粒度图像识别与分类算法仅使用训练样本的标签,不需要任何额外的标注信息,对传统的B-CNN网络结构进行优化改进,在双线性卷积提取过程中添加部件之间的几何约束来增加空间特征信息,进一步丰富了网络提取的特征。基于本文所提出的两种算法在14-Class BMVC车辆数据集、196类斯坦福汽车数据集和利福尼亚理工大学的鸟类细粒度数据集三个数据集上进行了细粒度分类实验,最优的分类准确率分别达到:94.8%、92.12%、86.36%,验证了本文所提出算法的有效性。针对本文提出的一些创新性观点我们也进行了相关的实验验证,得出了一些经验并进一步提出了接下来可以继续改进的方向。