基于卷积神经网络的场景分类

来源 :上海大学 | 被引量 : 0次 | 上传用户:kcb2639
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体与互联网技术的快速发展,数字图像的规模急剧膨胀,面对海量的复杂场景图像资源,如何对其进行有效地分类和管理,以方便图像资源的增量式存储管理和用户的快速准确的检索,就成为了机器学习和图像智能检索领域急需解决的难题,场景图像分类技术在这种情况下应运而生。针对传统场景图像分类需要手工设计特征并存在特征鲁棒性不强的问题,本文基于深度学习技术,用深度卷积神经网络提取场景特征进行分类,主要研究了以下几个方面的内容:1)迁移学习。本文直接利用在大规模数据集ImageNet上预训练的深度卷积神经网络CaffeNet模型来提取场景图像的初步特征,然后通过主成分分析法进行降维后得到最终的特征,最后将其输入到支持向量机分类器中进行标签预测。其中,深入探究了网络不同层输出的特征和主成分分析法降维对分类精度的影响。2)微调CaffeNet模型。对于小规模的场景数据集,由于过拟合的问题,一般很难从零开始去训练一个深度卷积神经网络。本文对CaffeNet模型最后一个全连接层进行微调,然后采用预训练CaffeNet的参数对微调后的模型进行初始化,最后根据不同层的特点来设置不同学习率并对整个模型重新进行训练,从而获得一个更具场景领域性的模型。3)特征融合。随着卷积神经网络的网络层次越深,越能捕捉到图像的全局特征,然而这样会不可避免的丢失隐藏在网络较低层中的图像局部特征。针对仅使用单层特征的不足,本文将卷积层的特征通过主成分分析法进行降维,然后将网络所有层的特征分别经过L2范数归一化后进行融合,从而提高特征的鲁棒性。
其他文献
介绍一种基于M642的视频无线传输系统,在此基础上重点探讨了关于TS流传输的问题,提出了使用McBSP和GPIO方式分别实现TS流传输,并给出了一种改进的乒乓方式。实验结果证明,采用McB
2011年4月25日,飞思卡尔半导体日前推出两个LDMOS RF功率晶体管,允许无线基站放大器覆盖整个分配频带中的所有通道。这两个高效率晶体管有助于降低运营和资本支出,它们的宽瞬
辅导员作为高校学生思想政治教育管理工作最基层的老师,决定其在抵御宗教渗透中的特殊作用。在日常工作中,辅导员要与所带的每位学生建立情感基础;旗帜鲜明地开展理想信念教
给出了基于变量投影重要性的质量功能展开关系矩阵计算方法。利用此方法,可以较好地解决工程特性之间多重相关性,也可用于消减关系矩阵维数。在某新型飞机经济性的关系矩阵构
<正>国家卫生部明确提出,医疗机构改革要“以病人为中心”。实现“以病人为中心”不仅要求医护人员,拥有精湛的业务技能,医院具备先进的医疗仪器,而且对医院的后勤服务工作提
介绍燃气用聚乙烯管材、管件、配套产品的生产技术和燃气用聚乙烯管道接头无损检测技术(超声波和X射线检测技术),探讨了聚乙烯波纹管内衬法用于旧管道非开挖更新与修复的技术
随着有线电视行业的迅速发展,GH有线公司在领军电视网络行业的同时也不断的扩张经营业务,企业经营管理也因业务的多重化而逐渐形成分层管理,也由基础电视传输业务向新型媒体
社会工作在社区矫正中的作用日益得到重视,但是存在着价值定位不明、法律效力位阶不高、参与质量和广度不够的局限。为此应当进行模式创新,实现三个转变:从治标型转向治本型
目的观察金银花水煎液体外抗铜绿假单胞菌生物膜的作用及与庆大霉素的协同作用。方法通过试管稀释法测定金银花水煎液和庆大霉素对铜绿假单胞菌的最小抑菌浓度(MIC),用MTT法
随着城镇经济的不断发展,城乡差距的不断缩小,城镇及农村地区的发展越来越受到重视,十八届五中全会将加快城镇化与城乡一体化进程写入“十三五规划”,各地基层政府纷纷探寻推