基于深度卷积神经网络的细粒度图像分类研究

来源 :昆明理工大学 | 被引量 : 0次 | 上传用户:jiajiayou123123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像识别作为计算机视觉发展史上最基本的问题之一,已经得到了广泛的研究。近几年,由于数据规模的不断增长,研究目标也发生了巨大变化。本文研究了最新并最具挑战性的目标识别任务之一,细粒度图像分类(Fine-Grained Visual Classification,FGVC)。细粒度图像分类问题是对子类进行识别。与以Image Net图像分类为代表的的通用图像识别(General Images)任务相比,细粒度图像识别的难点在于其目标图像所属类别的粒度更为精细。论文针对细粒度图像分类问题,分析了当前国内外的研究现状。考虑到当前基于强监督信息的细粒度图像识别方法已经达到不错的性能,但是它需要大量人工标注信息,耗费大量人力物力,不利于实际需求。从弱监督信息细粒度图像识别着手来改善细粒度图像识别性能,论文的主要工作包括:1)目前,残差网络(Res Net)和Inception网络在图像识别领域得到广泛使用,并且在Image Net数据集上取得优异性能,设计了一种结合上述两种网络的网络模型来提高细粒度图像识别的性能。2)卷积神经网络中常用的激活函数是线性整流函数(Re LU),本次研究过程中,在上述残差连接中使用PRe LU作为激活函数代替Re LU。PRe LU是Re LU的改进版本,增加了一个可学习参数,使负值部分的斜率是可以根据数据来确定。3)考虑到近期出现了许多创新型的卷积神经网络,而且它们在图像分类领域也取得了辉煌的成绩。对于双线性CNN模型(Bilinear CNN),使用性能比较好的Inception网络来作为特征提取器代替原有的特征提取器来提高双线性CNN的性能,从而来提高双线性CNN对细粒度图像的识别能力。通过在CUB200-2011鸟类公开数据集和Stanford Cars汽车类型数据集上进行测试,实验结果表明,设计的单网络模型的分类性能优于单一的残差网络和Inception网络,改进的双线性模型在两种数据集上分别达到了88.3%和94.2%的分类精度,与先前一些强监督算法不相上下,验证了本文方法的有效性。
其他文献
2016年,“十三五”的第一年,更是提出了对电子档案信息化建设的更高要求。由此可见,电子文件管理系统的设计以及未来的开发应用,对于当前分析我国“电子文件系统”建设现状,
随着监测设备的广泛使用,在交通、气象、金融等领域均可采集大量的多维时间序列数据。时间序列具有随机性、连续性和周期性的特点,对时间序列进行预测分析,预测结果可以有效
随着社会经济的不断发展,人们的需求逐渐从物质需求转向精神满足,通过观看电影产品来满足自己的精神需求成了人们生活的常态。动漫电影产业作为文化创意产业的一部分,得到了政策的青睐。在过去的几年里,政府出台了一系列方针、政策、规划、纲要,为国产动漫产业的发展,打了一个很好的辅助。各种力量涌向动漫产业,为动漫产业的发展带来了机遇,但是“投入者”的盲目热情、“观众”的产品对比、“旁观者”的过分关注、以及“有形
在面临市场竞争及企业转型时期,制定适合企业的竞争战略对企业有重要的指导作用。近年来,随着国内都市型现代农业的不断兴起,对都市型现代农业的理解观念认识上不到位、竞争战略规划不科学、产业化经营不强、产品参差不齐、服务水平偏低、雷同严重等问题逐渐显现。京郊草莓博览园被北京市定位为发展现代都市农业的探索基地,为了探索现代都市农业发展,在草莓博览园策划了北京农业嘉年华活动。北京农业嘉年华活动是探索都市型现代
纺织业是我国的传统优势行业,发展历史悠久,市场化程度高,长期以来一直依靠我国廉价的劳动力获得很强的价格优势。但随着全球经济动荡源和风险点的增多,原料、用工成本上升,以及国家环保标准的提高,行业竞争越来越激烈,一系列问题喷涌而出:产品同质化、产能过剩、消费者需求个性化、出口和内需增长乏力等。纺织企业必须厘清自身优势和不足,顺应经济发展趋势,制定恰当的竞争战略,形成核心竞争力,才能实现企业的可持续发展
伴随着“智能高铁”时代来临,高铁列车及旅客对车内无线通信网络提出了越来越高的要求,传统GSM-R铁路专网已无法满足高带宽、低时延的多样化业务通信需求,因此向下一代铁路通
所谓的延迟退休,是指国家根据社会年龄结构、就业市场压力和养老保险基金收支的变化状况对退休年龄进行上调的政策。随着我国人口数量増速降低、人口老龄化也带来了一系列的社会问题,使得日益上升的养老金需求与并不完善的养老保险制度之间的矛盾愈发尖锐。除此以外,社会保障制度转轨带来下了大量债务和欠账,会严重影响养老金的支付能力。根据由中国社会科学院世界社保研究中心撰写发布的《中国养老金精算报告2018-2022
随着科技的迅速发展,各个领域的情报信息、研究成果产量迅速增长,而如何快速找到符合科技人员兴趣的信息成了亟待解决的问题。信息过载的现象加速了推荐系统的研究。情报推送技术旨在联系科技人员与科技文献、技术报告、新闻等情报信息库,为科技人员及时准确地推送符合其需要的情报信息。科技文献和技术报告等是科技人员了解当前技术前沿、学术动态的重要途径之一。针对仅从用户评分信息单一角度的推荐系统存在的冷启动问题,本文
在文献数据库中会存在许多相关性极低的论文,这些文章署名相同,但实际并不是同一个人,称之为同名问题,这严重影响了检索的质量。此外,同一个作者可能超过一个的名称变体,称之为共指问题,例如姓名缩写不同、工作机构调动,都会导致不完整的查询输出。这些都属于同名消歧问题。同名消歧的本质是一种利用知识库进行命名实体消歧,即将文本中的实体指称映射到知识库中对应字段的方法。本文中的命名实体识别特指科技文献作者识别,
验证码(Completely Automated Public Turing Test to Tell Computers and Humans Apart)是一种保护计算机免受恶意程序侵扰的有效机制。其工作原理,是利用对于机器而言难以解决的AI问题,来区别合法的人类用户以及非法的恶意程序。以目前最广泛使用的文本验证码以及图形验证码为例,其背后的AI问题分别是字符识别以及目标识别问题。随着大数据时