论文部分内容阅读
本文研究卷积神经网络在入脸-背景二分类识别、手写数字识别、多类图像分类识别和景物标记中的应用。本文采用具有不同特征抽取过滤层的卷积神经网络与其他优化模型相结合的方法,获得相同图像在不同尺度卷积核的图像信息。探究了基于多尺度卷积神经网络模型的多景物图像标记问题,同时将改进后的多尺度卷积神经网络应用于Stanford Background数据集与SIFT Flow数据集的景物标记实验中,提高了景物标记的正确率。本文的主要工作如下:(1)采用具有不同特征抽取过滤层的卷积神经网络方法分别进行了人脸-背景二分类实验、手写数字识别实验和多类图像分类实验,同时和其他训练模型的结果作对比,还探究了一下卷积神经网络的结构特征。其中,人脸-背景二分类实验所得的平均分类正确率达到了99.785%:手写数字识别实验中,在各种结构下的训练模型中卷积神经网络与随机梯度下降法的组合平均分类正确率最高达到了96.7%,比平均正确率次高的双层神经网络与随机梯度下降法的组合提升了8.1%;多类图像分类实验中,在各结构下的训练模型中卷积神经网络与随机梯度下降法的组合平均分类正确率最高达到了66.7%,比平均正确率次高的双层神经网络与随机梯度下降法的组合提升了52.3%。同时在此实验中还探究了线性校对单元与池化方式分别对卷积神经网络提取图像特征的影响。(2)针对图像的景物标记问题,本文探究了一种多尺度卷积神经网络,即使用不同尺度的卷积核来提取图像特征,以获得相同图像在不同尺度卷积核下的图像信息并将这些图像特征用于对测试集图像的景物标记。在Stanford Background数据集的景物标记实验中,运用多尺度预处理图像与卷积神经网络相结合的方法将景物标记的正确率提高了33.5%。后将改进后的多尺度卷积神经网络应用于SIFT Flow数据集的景物标记实验中,将景物标记的正确率提高了36.3%。实验验证了卷积神经网络在解决图像标记问题时可以通过提取图像特征的不同尺度来达到提高训练正确率的效果。实验还验证了线性校正单元与Dropout对卷积神经网络训练的泛化作用。