【摘 要】
:
细粒度图像分类是指对大类下的子类进行更加精细的划分,比如区分一只鸟是海鸥还是大雁。随着人工智能的发展,同一基本类别下的物体的子类别分类的需求日益增多,如商品的品牌分类、植物研究领域的植物分类、车辆的型号和品牌分类等。然而,由于细粒度图像类别之间的差异很小,类别内部差异较大的原因,细粒度图像分类是一项非常困难的任务。由于子类别通常具有较小的类间差异,需要靠微小的局部差异对类别加以区分。论文在深度学习
论文部分内容阅读
细粒度图像分类是指对大类下的子类进行更加精细的划分,比如区分一只鸟是海鸥还是大雁。随着人工智能的发展,同一基本类别下的物体的子类别分类的需求日益增多,如商品的品牌分类、植物研究领域的植物分类、车辆的型号和品牌分类等。然而,由于细粒度图像类别之间的差异很小,类别内部差异较大的原因,细粒度图像分类是一项非常困难的任务。由于子类别通常具有较小的类间差异,需要靠微小的局部差异对类别加以区分。论文在深度学习框架下,研究了如何增强对局部区域的关注,即如何进行区域信息增强来提高细粒度图像分类网络的性能,并且研究了该技术在车辆检索与识别中的应用。主要研究成果如下所述:(1)针对现有的分层双线性池化(Hierarchical Bilinear Pooling,HBP)网络对一幅图像包括无关背景在内的所有区域激活都进行了特征交互从而影响分类性能的问题,提出了显著增强分层双线性池化(Saliency Enhanced HBP,SE-HBP)网络。该方法在分层双线性池化网络的基础上,结合显著性检测网络生成注意力图,使用注意力图与特征提取网络进行交互实现显著区域的信息增强,减少了背景等无关信息的影响。最后在3个常用的细粒度图像数据集CUB-200-2011、Stanford Cars和FGVC-Aircraft上得到的分类准确率分别为86.5%、92.9%和90.8%。(2)针对现有的强监督方法过度依赖额外人工标注及参数量较大的问题,提出了基于部件信息蒸馏(Component Information Distillation,CID)的细粒度图像分类。先利用部件标注样本训练出教师网络,通过与学生网络的交互蒸馏出部件信息指导学生网络进行细粒度图像分类训练,从而使得学生网络实现部件区域信息增强。学生网络通过接受教师网络提供的软标签完成训练。测试使用学生网络,此时仅需要输入原始图像,即可获得高精度识别结果,且不增加额外的参数量。在CUB-200-2011、Birdsnap上得到的分类准确率分别为88.0%、81.3%。(3)搭建了车辆检索与识别系统,对部件信息蒸馏(CID)算法在车辆检索与识别任务中的应用进行了探索。先利用卡口车辆图像以及CID算法,训练出车辆识别模型,再将其应用到系统中,分别构建了离线车辆检索系统与在线车辆识别仿真系统。此处的车辆识别网络对车辆进行精细分类,即可以识别出相同品牌车辆下的不同型号。离线车辆检索系统可以在卡口车辆数据库中检索符合条件的车辆;在线车辆识别仿真系统主要针对于道路监控,可以对监控视频中的车辆进行实时识别。最后分别构建了离线检索系统与在线识别仿真系统的图形界面,并在卡口车辆数据集与真实道路视频上进行测试,验证了论文研究内容的有效性。
其他文献
基于现有VR技术的相关应用,探索如何利用VR技术实现对孙温《红楼梦》绢本画的数字化设计。主要寻找传统文化内容与虚拟现实技术的交叉点,并利用VR技术实现对孙温《红楼梦》绢本画的交互性展示,为用户带来兼具沉浸性与真实感的虚拟体验。在设计过程中以孙温《红楼梦》绢本画的多形态交互性展示即VR系统中界面功能设计为突破口,使其审美性与交互性在虚拟体验之中结合形成文化内涵的跨媒介传播与表达。提高《红楼梦》相关文
随着图形化信息技术的生活化渗透与大众常态化文娱需求的日渐提升,视觉文化迅速发展成为人们精神生活和文化生活的主要感知感受方式,公众的艺术审美能力和视觉美学鉴赏力普遍提升,视觉价值标准与审美需要也在不断被重塑。但是从当前传统剪纸文化的传承发展现状而言,其视觉构成上的转化完成度以及视觉文化信息的活态体验呈现远远不能满足用户的使用、审美以及情感诉求。传统文化视觉构建惯式大多仍停留在对传统文化内容元素的跟踪
图像融合的基本思想是利用特定算法将多种传感器对同一场景获取的图像提取不同信道的有用信息,最后融合成高质量的图像,以提高图像的利用率、可信度和准确性,在军事监测、医疗诊断和目标识别等领域广泛应用。在过去的几十年中,许多传统的图像融合方法被提出,这些图像融合算法大致可以分为两类,即空间域算法和变换域算法。空间域算法首先根据某种策略将源图像划分为若干个图像块,然后对每对图像块根据计算活动度量融合在一起。
随着电子信息技术的快速发展,印刷电路板(PCB)应用越来越广泛,为准确高效地对其进行检测,自动光学检测技术(AOI)逐渐发展起来且已被应用于实际生产。目前,AOI技术主要采用2D视觉检测方法,但是由于元器件表面字符印刷方式不同,元器件字符凹凸性不同、颜色和大小多样,2D字符识别系统的鲁棒性低,准确性不足。而PCB的3D点云(3D-PCB)数据中的高度信息能有效增强PCB的2D图像(2D-PCB)中
在食品3D打印过程中,大多数食品材料水分含量较高,流动性较强,且无光固化性、热熔性等固化特征,打印制品易发生形变、坍塌、流淌等现象。目前主流的解决方案是调整浆料组分,使浆料获得较好的流体力学性质,在流畅挤出的同时,保持结构强度。但此方案下打印的制品仍为流动态,无法规避打印及后加工处理过程中的形变因素。因此,本研究通过构建多物理场仿真模型,开发微波3D打印固化单元,以具有良好3D打印属性的鱼糜为打印
电子游戏已经成为大众生活中越来越重要的休闲娱乐活动之一,而功能游戏这一新的游戏品类由于具有较大的社会价值,正受到越来越多的关注。功能游戏强调其文化、教育等多重功能,不仅会影响到用户的体验感受,同时也关系到游戏功能作用的传达效果。认知负荷理论是现代认知心理学基础上发展而来的重要理论,具有广泛的应用能力与实操价值,早先已经有众多研究者将其运用于教育学领域用以验证学习成效,近年来也逐渐被运用到产品设计领
无线射频识别(Radio Frequency Identification,RFID)作为一种使用射频信号进行信息交互的技术,有效地实现物与物之间的非接触性识别的短距离通信技术,被广泛应用于智慧仓储、智慧驾驶、安防以及军事等多种前沿的领域中。在被广泛应用的同时,RFID系统存在的安全隐私、阅读器可移动性等问题也受到大家的关注。面对这些问题,国内外研究学者致力于提出一种有效的RFID安全认证协议来提
随着信息技术的快速发展,各行各业所创造的数据总量以惊人的速度快速增长。为了能从海量的数据中获得有效的信息,数据挖掘技术应运而生。目前,数据挖掘已被广泛应用于多个领域,在全球竞争、社会生活等方面均发挥了重要作用。但是在实际应用中,人们发现很多数据集的样本并不是均衡分布的。而且,传统分类算法是建立在数据分布均衡的基础上,处理不均衡数据会过多关注多数类样本,难以保证更有分类价值的少数类样本的分类性能。因
随着计算机视觉技术的发展,目标跟踪技术作为其中一项研究热点,在医学诊断系统,智能交通,机器视觉,行为识别等领域都有着广泛的应用。虽然,近些年国内外专家学者对目标跟踪技术贡献了各种各样的算法,但由于复杂多变的目标跟踪应用场景,依然面临着诸多挑战,例如:运动模糊,低分辨率,平面内(外)反转,物体遮挡等。这些挑战使得现有目标跟踪技术的跟踪效果与专家们的预期还有一定的距离。因此,如何提高跟踪技术的效率和稳
近年来,随着图像传感器技术及图像处理算法的日趋成熟,机器视觉检测技术在检测精度大幅提升的同时,其自动化检测生产线的成本大幅下降,这使得机器视觉检测技术在生产和生活的各个领域中得到广泛应用。但由于被检测物体种类丰富多样,表面特性变化多端,导致机器视觉缺陷检测技术在某些对光源要求严格的低适光性物体表面缺陷检测的应用中存在一定困难。为此,本文以高纹理物体表面和高反光曲面等低适光性表面为主要研究对象,设计