论文部分内容阅读
图像分类以及检索一直是图像领域的经典问题,随着移动互联网的快速发展,图片信息量也呈爆炸式增长,对海量图片信息的分类已经成为一个研究热点。传统的图像分类方法针对特定的图像由人工去设计特征,其鲁棒性较差,而且需要丰富的先验知识。卷积神经网络方法则在该领域取得了重大突破,它可以自动从海量图片中学习到属于原始图像的本质特征进行分类,相比传统方法具有更好地识别率和实用性。卷积神经网络模拟人的视觉系统,将特征的提取过程分为从低到高多个层次,以网络深度获得高度抽象特征,它直接将图片作为网络的输入,并且利用局部感受野、权值共享和子采样技术减少网络参数数量,从而避免权值数量过多导致过拟合,也使网络具有一定程度上的平移、旋转和扭曲不变性。目前,卷积神经网络已广泛应用于图像检索,其识别率和实用性均优于传统的分类方法,因此对卷积神经网络在图像内容检索上应用的研究具有十分重要的意义。本文主要从实际应用和网络改进两方面进行研究,论文的主要工作如下:(1)针对CNN网络模型设计的过程中,各参数如何选择的问题,通过调整CNN中卷积核的个数和大小、采样层的搭配方式以及激活函数进行对比实验,发现在增加卷积核个数、减小核尺寸、使用Relu激活函数、第一个采样层使用最大值采样这些情况下,CNN在MNIST和CIFAR-10数据库上的性能更好。(2)针对古玩图片数据集的分类,提出一种图片大小不一情况下数据预处理的方法,解决图片目标在格式统一时发生形变的问题;提出一种目标与背景分离后再输入到CNN的方法,并在古玩数据集进行实验验证该方法所用的CNN相比图片直接输入CNN,其网络结构更简单,识别率更高;通过实验验证CNN在图片包含多目标的情况下仍然具有优秀的分类性能;针对整个古玩数据集各类别样本数量不平衡的情况,提出CNN结合HOG+SVM的方法进行分类,并通过实验证明该方法比直接利用CNN分类的识别率要高。(3)针对CNN中常用的采样方式各有优缺点的情况,提出一种在采样层分别进行最大值采样和均值采样的网络模型(并行采样模型),实验验证该模型相比传统CNN泛化性能更好;另外,提出一种对CNN进行预训练,使网络训练时可以剔除噪声样本的方法,解决在训练样本中有噪声时直接训练网络会无法收敛的问题。