基于多尺度卷积神经网络的车型识别

来源 :郑州大学 | 被引量 : 0次 | 上传用户:jiebaidexue
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
卷积神经网络用于图像识别分类是深度学习中有关图像处理的一个重要应用,卷积神经网络一个比较显著的优点是能够直接使用图像进行卷积操作,并从图像的像素中提取图像的特征,而且卷积神经网络的权值共享和池化操作大大减少了网络需要训练的参数,从而大大的简化了网络的结构,使网络的训练效率提高了。  然而传统的卷积神经网络只能对灰度图像以及彩色图像通道中的某一个通道进行学习训练,并且只能提取图像的局部特征从而使图像的一些重要信息不可避免的丢失了,然而图像的局部特征和全局特征同样对图像的分类识别起着重要的作用,而深度学习是人工智能领域内发展的重要组成部分,并且深度学习在指纹识别、图像分类识别以及人脸识别等方面都获得了很大的成绩,用传统卷积神经网络不容易解决的物体的检测、物体的跟踪以及车牌自动识别的问题也获得了很大的突破。目前,随着研究人员对深度学习算法的不断研究及优化,传统深度学习的编程算法已经远远满足不了编程人员的需要,因为传统的基本算法的实现都需要研究人员耗费大量的时间以及精力,而同时一些研究人员已经开始追求快速、高效的深度学习算法,从而基于Caffe深度学习框架中的多种深度学习框架便应运而生了,而这些框架不但给研究人员提高了快速、高效的开发模式,而且还提供了多个卷积神经网络的开发模型以使研究人员在比较先进以及完善的模型上进行改进以及研究。  本论文基于深度学习Caffe框架中的AlexNet模型,提出了一种基于多尺度深度卷积神经网络(multi-scale convolutional neural network,即MSCNN)的模型。MSCNN模型首先对原始图片进行下采样得到多个尺寸的图像,并作为训练样本,对训练样本进行多个通路的训练学习,每个通路与其相对应的滤波器进行卷积操作,得到图像的特征维度,然后把每个通路得到的特征维度通过一个全连接层进行融合,最终得到的特征用于图像识别分类,并把得到的最终特征作为输入数据输入到分类器中完成对物体的识别。实验表明:本文所提出的MSCNN结构模型对图像的识别获得了更高的识别率。  本论文通过不相同的数据集在对网络结构以及网络参数优化的研究上进行了测试,通过分析总结了深度学习对于图像识别分类的几点实行的规律,由于对于一样的深度学习网络结构,调节参数的好坏对其性能有直接的影响,因此对解决实际的问题有很好的指导作用。
其他文献
随着中国铁道线路的快速发展和建设,养路机械产品市场竞争变得越来越激烈。而养路机械售后服务质量在提高企业市场竞争力和保持铁道线路良好状态中起着非常重要的作用,通过运
随着网民规模、网站规模的持续增长,互联网上的信息量快速递增,信息检索技术越来越被人们所重视。蒙古文作为内蒙古自治区的主体民族文字和官方文字,在各个领域中都被广泛使
视频监控系统在人们的日常生活中越来越普及,为人们的生活提供了安全和便捷。随着技术发展,为了更加提高监控系统的智能化,各种关于监控系统的智能化技术成为研究热门。在智能化
超点是在一个测量区间内链接了大量源IP(宿IP)的宿IP(源IP),实时超点检测对网络安全和管理具有重要意义。网络中的许多安全事件,如分布式拒绝服务攻击(DDoS)、蠕虫病毒、端口
图形显示控制器作为实现人机交互的重要部件之一被广泛应用于各个领域,针对嵌入式领域的图形显示控制器设计和优化已经成为研究热点。近年来液晶显示技术的发展使得液晶显示
随着云计算和物联网技术的兴起,联网设备逐渐向移动化、小型化、功能集成化发展,会话初始化协议(Session Initiation Protocol, SIP)协议以其无缝、灵活、可扩展的特性顺应了
随着互联网的不断发展,网络上的信息量也在不断的增长,其中各种各样的学习资源也在不断增加,这为人们学习提供了充足的资源,但同时也为用户获得准确的资源带来了很大的难度。
交通标志检测与识别作为辅助驾驶及智能交通系统的一部分,具有广泛的应用前景。由于场景的复杂性以及交通标志的多样性,目前对交通标志的自动检测和识别水平还不能满足实际的
随着互联网的迅速普及,Web上的垃圾网页也逐渐增多,这极大的影响了搜索引擎的精度和效率,如何识别垃圾网页已经成为互联网搜索所面临的最严峻的挑战之一。通过对垃圾网页深入
近年来,车载自组网(VehicleAd Hoc Network,简称VANET)引起世界各国政府、学术界以及工业界的广泛关注。交通安全信息传输是车载自组网中一种重要的应用。许多交通安全应用需要交