论文部分内容阅读
深度学习作为传统机器学习的分支,在近10年中取得了令人瞩目的成果。它通过组合多个非线性的特征提取器,实现数据向高维度的变换,从而发现数据中分布式特征标志。深度学习能够自动完成特征提取器的生成,这克服了传统机器学习算法的劣势。深度学习技术现阶段被广泛应用在计算机视觉,自然语言处理等方面,极大的提高了人们的生活水平。在深度学习技术中,通常用于处理图像数据的模型是卷积神经网络。卷积神经网络通过多层的卷积运算提取图像不同层次的高级特征,并且利用这些特征用作分类和分割等任务的参考依据,这样处理的过程类似于人类初级视皮层对于视觉信息的处理流程。通常情况下,设计一个深度学习的网络模型并且编写代码需要科研人员长时间的工作,这对于科研效率是有很大的影响的。在本次毕业设计中,我们选用了现阶段成熟的开源卷积神经网络框架Cafffe,利用Cafffe模块化和接口丰富等特征,能够快速实现科研人员的实验范式。本文基于Caffe这个卷积神经网络框架进行了以下几方面的工作和研究:首先,介绍了近年来深度学习技术在图像识别,自然语言处理等领域的研究现状,简单介绍了现阶段深度学习依赖的软硬件技术和实现框架,并且着重介绍卷积神经网络框架Caffe。其次,结合人类视觉信息处理的脑机制和机器学习中的神经网络模型,介绍了传统浅层学习中经常使用到的感知机,并且介绍了常用的深度学习算法模型。最后着重介绍了在图像处理领域广泛使用的卷积神经网络的原理和结构。再次,通过对训练后的卷积神经网络权值进行可视化可以发现,这些几何图案具有非常明显的生理意义。在本文中我们利用具有生理意义的Gabor滤波器对卷积神经网络的初级卷积层权值进行了修改,并将修改后的卷积神经网络在MNIST和CIFAR10数据库上进行了测试,提升卷积神经网络的性能表现,并且定量地分析改进后模型与原始模型之间的差异。接着,由于色偏图像中存在的灰度点具有丰富的统计信息,可以完成对色偏的矫正。所以我们设计了一个卷积神经网络对图像中每一个像素点是否是灰度点进行了预测,用以帮助颜色恒常性计算。整个框架对灰度点的预测取得了一定的效果。最后:简单回顾硕士期间的工作,总结了研究工作的不足,并对以后的进行了展望。