基于卷积神经网络的景物标记

来源 :北京交通大学 | 被引量 : 5次 | 上传用户:chenchen19880908
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文研究卷积神经网络在入脸-背景二分类识别、手写数字识别、多类图像分类识别和景物标记中的应用。本文采用具有不同特征抽取过滤层的卷积神经网络与其他优化模型相结合的方法,获得相同图像在不同尺度卷积核的图像信息。探究了基于多尺度卷积神经网络模型的多景物图像标记问题,同时将改进后的多尺度卷积神经网络应用于Stanford Background数据集与SIFT Flow数据集的景物标记实验中,提高了景物标记的正确率。本文的主要工作如下:(1)采用具有不同特征抽取过滤层的卷积神经网络方法分别进行了人脸-背景二分类实验、手写数字识别实验和多类图像分类实验,同时和其他训练模型的结果作对比,还探究了一下卷积神经网络的结构特征。其中,人脸-背景二分类实验所得的平均分类正确率达到了99.785%:手写数字识别实验中,在各种结构下的训练模型中卷积神经网络与随机梯度下降法的组合平均分类正确率最高达到了96.7%,比平均正确率次高的双层神经网络与随机梯度下降法的组合提升了8.1%;多类图像分类实验中,在各结构下的训练模型中卷积神经网络与随机梯度下降法的组合平均分类正确率最高达到了66.7%,比平均正确率次高的双层神经网络与随机梯度下降法的组合提升了52.3%。同时在此实验中还探究了线性校对单元与池化方式分别对卷积神经网络提取图像特征的影响。(2)针对图像的景物标记问题,本文探究了一种多尺度卷积神经网络,即使用不同尺度的卷积核来提取图像特征,以获得相同图像在不同尺度卷积核下的图像信息并将这些图像特征用于对测试集图像的景物标记。在Stanford Background数据集的景物标记实验中,运用多尺度预处理图像与卷积神经网络相结合的方法将景物标记的正确率提高了33.5%。后将改进后的多尺度卷积神经网络应用于SIFT Flow数据集的景物标记实验中,将景物标记的正确率提高了36.3%。实验验证了卷积神经网络在解决图像标记问题时可以通过提取图像特征的不同尺度来达到提高训练正确率的效果。实验还验证了线性校正单元与Dropout对卷积神经网络训练的泛化作用。
其他文献
GCC是GNU中的旗舰产品,也是开源世界的重量级产品,大多数开源产品都是基于这个编译器的。GCC是一个编译器的集合,其中的C++编译器就是G++。GCC采用前端、后端相结合的方式,前
剪接体内含子的发现已有30余年,但目前对其进化机制和进化动力学的了解很贫乏。学术界对内含子的进化问题一直存在争议,其中之一就是内含子得失率。内含子的进化研究方法常是用
无线传感器网络作为进化计算中崭新的一章,已经被证明了对诸多的领域,如国防安全、监控、环境监测、农业、以及医疗,起到了巨大的推动作用。由于它在物理世界以及数字世界之间的
关联规则挖掘是数据挖掘中的重要内容之一,旨在发现大量数据中项集之间的关联或相关关系。将关联规则挖掘技术应用于Web使用挖掘中,可以更有效地组织和管理网站,找出站点用户
无线自组织网是近年来随着无线通信技术的飞速发展而出现的一种新型网络,网络中所有节点可以任意移动,网络拓扑结构动态变化,节点间以多跳协作的方式进行通讯。作为无需基础
下一代互联网为用户带来了丰富多彩的用户体验,但同时庞大的网络流量也给网络管理人员及服务提供商带来了巨大的挑战。流量监测是保障网络可控性的基础。目前传输速率为10Gbp
专利的技术方案信息是专利信息的重要组成部分,是专利作者创新精髓,是专利保护的主要对象。然而技术方案信息是以自由文本的形式存在,因此如何将技术方案信息转化为计算机可处理
流媒体点播(Video-on-Demand)系统的应用随着宽带技术的日益成熟而得到越来越多的关注。系统的结构也由最初的C/S架构转为现在流行的P2P(Peer-to-Peer)模式,因为P2P模式可以更
随着信息技术的飞速发展,人们从信息匮乏时代过渡到了信息过载时代,用户很难从海量的数据中找到自己感兴趣或对自己有价值的信息。推荐系统是应对信息过载问题的一个有效的解
随着互联网服务提供商提供的服务越来越多,互联网结构也变得越来越复杂,网络测量在互联网管理和服务质量保证方面扮演着重要的角色。由于互联网管理范围非常宽广,对作为运营