基于深度学习的图像识别技术与应用研究

来源 :西安工程大学 | 被引量 : 0次 | 上传用户:wang8327501
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
日常生活中图像作为一种信息源处处可见,相对于其他信息源而言信息含量巨大,图像的复杂、冗余等特性将其与其他种类信息源区分开来。近年来,人类视觉系统在图像处理方面的研究,已经受到越来越多的关注。深度学习是机器学习算法的一种,在图像和语音识别方面取得了很好的效果,使机器模仿人脑思考视听等活动,使得人工智能取得了很大的进步。论文的主要研究内容有:论文针对传统图像识别方法需进行手工抽取特征的局限性及传统卷积神经网络的结构,对卷积神经网络模型进行了改进,并应用到手写字体识别和人脸识别中,取得了良好的效果。(1)研究了Caffe深度学习方法,搭建了Caffe深度学习框架平台。(2)对卷积神经网络的结构及改进方法进行研究,在卷积过程中,使用ReLU激活函数替代传统sigmoid和tanh激活函数,然后对提取到的特征采取最大池化方式,不仅降低了特征的维数,增加网络的可计算性,同时使提取的特征具有一定的平移不变性,再引入dropout技术解决网络的过拟合问题。(3)将改进的卷积神经网络CNN1-R、CNN3-R应用到手写字体识别和人脸识别中,通过实验分析其算法的优劣性,通过比较不同结构下的训练结果,CNN3-R在手写字体的识别中准确率要高于CNN1-R网络,证明改进网络的可行性,CNN3-R不仅识别率可以达到99.16%同时loss损失值也能在短时间内收敛。(4)用Gabor滤波器来代替卷积层中的卷积核改进模型CNN-G应用到人脸识别中,同时将5个不同尺度下的6个斜方向的Gabor滤波器固定为第一个卷积层对应的卷积核,然后分别在ORL、Yale B人脸识别库上进行实验,与CNN-G+SVM和PCA+SVM的方法进行比较,当特征维数为120时,单尺度下CNN-G取得的分类较优于PCA+SVM的方法。随着特征维数的降低,多尺度CNN-G的分类效果更好。
其他文献
在本文当中首先介绍现代企业成本管理领域中存在的问题,并提出一些应对措施,而后详细介绍ERP成本管理的含义、优势及方法,希望能够在日后各个企业应用ERP标准成本控制法的过
目的观察并分析采用血液灌流联合血液透析治疗急性重症胰腺炎所取得的疗效。方法以本院2009年1月至2012年12月接收治疗的43例重症胰腺炎患者为临床资料,对患者先进行内科常规
随着现代教育技术与互联网科技的快速发展,传统的大学体育教学已经很难适应学生的学习行为特征。通过应用文献资料、逻辑分析等方法等,对传统的、固化的、程式化的大学体育教
路面施工要尽量避免和减少出现裂缝,这是市政公路施工追求的重要目标之一。文章从分析公路路面裂缝的种类入手,初步分析了引发裂缝的几个主要因素:设计、施工、材料和载荷等,
大数据帮助企业实现了数据的集中整合处理,进而为企业不同阶段的发展提供数据支撑。本文对大数据为企业财务会计工作带来的挑战进行总结,并从改善传统的会计管理理念、财务会
内部审计参与工程管理能够提高工程管理质量、增强各相关人员依法治企意识,从主观意识上提升各职能部门的管理责任,加强工程管理力度,由事后规范转变成提前规范。改变各职能
航运公司作为水上交通安全的责任主体,是水上交通安全管理的重要源头之一。在我国,建立安全管理体系的公司只是一部分,其余很多航运公司都是未建立安全管理体系的“非体系公
<正> 柚在“离离朱实绿丛中,似火烧山处处红”的深秋,犹如一枝奇葩,犹似柑桔王国中的骄子。它系柑桔之大者,古谓之苞,或称抛、栾、气柑、文旦等等。其果大如升,每果一般重2~3
如果上帝是至善,上帝所造的整个世界是好的,那么为何有恶?恶是从哪里来的?这个问题是奥古斯丁一直思考的问题。恶的来源与“虚无”有关。奥古斯丁吸收了新柏拉图主义的“恶是
近两年,我国政府在大力推广PPP模式,特别是对水务行业。PPP模式引入社会资本参与城市基础设施建设,具有融资成本低、运营效率高等优势,适合我国水务行业项目。本文首先通过分