【摘 要】
:
目的在细粒度视觉识别中,难点是对处于相同层级的大类,区分其具有微小差异的子类,为实现准确的分类精度,通常要求具有专业知识,所以细粒度图像分类为计算机视觉的研究提出更
【基金项目】
:
国家自然科学基金项目(31200544)~~
论文部分内容阅读
目的在细粒度视觉识别中,难点是对处于相同层级的大类,区分其具有微小差异的子类,为实现准确的分类精度,通常要求具有专业知识,所以细粒度图像分类为计算机视觉的研究提出更高的要求。为了方便普通人在不具备专业知识和专业技能的情况下能够区分物种细粒度类别,进而提出一种基于深度区域网络的卷积神经网络结构。方法该结构基于深度区域网络,首先,进行深度特征提取任务,使用VGG16层网络和残差101层网络两种结构作为特征提取网络,用于提取深层共享特征,产生特征映射。其次,使用区域建议网络结构,在特征映射上进行卷积,产生目标区域;同时使用兴趣区域(Ro I)池化层对特征映射进行最大值池化,实现网络共享。之后将池化后的目标区域输入到区域卷积网络中进行细粒度类别预测和目标边界回归,最终输出网络预测类别及回归边框点坐标。同时还进行了局部遮挡实验,检测局部遮挡部位对于分类正确性的影响,分析局部信息对于鸟类分类的影响情况。结果该模型针对CUB2002011鸟类数据库进行实验,该数据库包含200种细粒度鸟类类别,11 788幅鸟类图片。经过训练及测试,实现VGG16+R-CNN(RPN)和Res101+R-CNN(RPN)两种结构验证正确率分别为90.88%和91.72%,两种结构Top-5验证正确率都超过98%。本文模拟现实环境遮挡情况进行鸟类局部特征遮挡实验,检测分类效果。结论基于深度区域网络的卷积神经网络模型,提高了细粒度鸟类图像的分类性能,在细粒度鸟类图像的分类上,具有分类精度高、泛化能力好和鲁棒性强的优势,实验发现头部信息对于细粒度鸟类分类识别非常重要。
其他文献
随着苋带普及,互联网中取之不竭的各种资源都可以更加容易地为我们所占有。视频、软件、图书、歌曲……这么多不同种类的资源,该如何一网打尽了?针对这个问题,资源聚合门户便孕育
在教学当中培养其阅读能力, 是小学语文教学的重要内容.传统的阅读教学方式是教师的主动讲授与学生的识记, 传统阅读教学注重的是知识传授, 忽略了学生的主体性地位, 因此效
随着移动设备的快速发展和图形硬件加速器种类的与日俱增,图形API库的灵活性和高效性显得尤为重要。传统图形应用程序开发是基于特定的图形API标准在其专用图形处理器上实现
急性缺血性脑卒中是指发病30天内的缺血性脑卒中。包括超早期(3~6h)、时期(3~5天内)以发直至30天。这段时间的治疗对患者预后有非常重要意义.故急性期对患者进行科学的、合理的、符
总结3D技术在成人发育性髋关节发育不良(DDH)患者中的研究进展。广泛查阅3D打印技术在成人DDH患者应用的相关文献,对其概念、原理、术前规划、个体化假体制造、问题和不足等
<正>1内容和范围1.1内容本规程依据广陈皮药材的生长特点和国家药品监督管理局《中药材生产质量管理规范》(试行)的要求,规定了广陈皮的产地自然条件、育苗、移栽与田间管理
过敏性支气管炎多为干咳无痰,夜间或清晨加剧。咳嗽可反复1个月以上,应用抗生素无效,而使用抗过敏药物、糖皮质激素或支气管扩张剂可使咳嗽症状缓解。临床上,患者往往以反复咳嗽
【正】 什么是“三来一补”企业 “三来一补”是四种利用外资形式的总称。其内容是: (1)来料加工。来料加工是“三来一补”企业的主要形式,其做法是:我方提供生产所需的厂房
池塘老家晓塘冲都习惯把不大的鱼塘叫做池塘。池塘就在一片枣树林的下面,只有两分地那么宽。这是我家的池塘,准确地说,它是父亲的池塘。因为父亲不会种田,他是我们晓塘冲唯一
这个姑且称之为新中产的群体,以70后以及小部分80后为构成主体。$$早晨出门,代步车非奔驰即宝马,或是现时流行的特斯拉,车价怎么着也得五十万以上。早餐通常不会选路边摊的豆浆油