论文部分内容阅读
卷积神经网络进行图像分类是深度学习关于图像处理的一个应用,卷积神经网络的优点是能够直接与图像像素进行卷积,从图像像素中提取图像特征,这种处理方式更加接近人类大脑视觉系统的处理方式。另外,卷积神经网络的权值共享属性和pooling层使网络需要训练的参数大大减小,简化了网络模型,提高了训练的效率。本论文主要围绕卷积神经网络的网络设计和参数优化两个方面进行深入的研究。卷积神经网络分类性能的好坏很大程度决取于网络层数和网络参数,如何合理地设计卷积神经网络的卷积层,隐含层的数目和优化卷积神经网络的参数是卷积神经网络关于图像分类应用研究中非常重要的环节。本论文主要在caffe框架平台上进行卷积神经网络的网络结构设计和参数优化。首先设计了一个5层网络层的浅层卷积神经网络,分别使用mnist手写图像库和cifar-10图像库进行训练,测试和参数优化。测试结果表明浅层卷积神经网络能够很好地处理像mnist简单的图像分类任务,但是对于比较复杂的cifar-10图像库分类效果并不理想。接着设计了一个9层网络层的复杂卷积神经网络,分别使用了cifar-10和cifar-100图像库对复杂卷积神经网络进行训练,测试和参数优化。测试结果表明复杂卷积神经网络能够处理像cifar-10、cifar-100比较复杂的图像库分类任务。5层浅层网络和9层复杂网络的实验结果说明了网络层的深度对网络的性能影响很大。本论文通过对网络结构和参数优化的研究及在不同数据库上的测试,分析总结了深度学习关于图像分类的一些实践性的规律,对于解决实际工程问题具有较好的指导作用,因为相同的深度学习网络,调参的好坏对性能具有非常大的影响。本论文的结论也可以用于其他领域的深度网络。最后在本论文在总结的卷积神经网络用于图像分类的实践规律上实现了一个图像分类演示系统。该系统简单易用,图像分类效果良好。