基于特征选择和多尺度特征融合的细粒度图像分类

来源 :安徽大学 | 被引量 : 0次 | 上传用户:phirst
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了进一步提高生产效率,降低人力成本,大量企业逐渐重视对于人工智能领域相关产品的研发。而计算机视觉作为人工智能领域的重要组成部分,吸引了越来越多研究者的关注,尤其是细粒度图像分类方向,拥有着广泛的应用前景。如果能够开发出低成本的细粒度图像分类技术,将其运用到生态环境的监测中,能够进一步推动生态系统研究的发展。此外,还能提高超市自助结账系统的效率以及实现在交通事故中对于可疑车辆的有效追踪。然而,类内差异性大和类间相似性高的特点使得细粒度图像分类成为了一个充满挑战性的研究方向。只有拥有专业领域知识的人才能对不同子类进行有效识别,从而导致标注成本高。为了克服细粒度图像分类任务中所面临的困难,研究者们开发出了大量的细粒度图像分类算法,这些算法大体上分为三类,基于局部定位的细粒度图像分类算法、基于细粒度特征学习的细粒度图像分类算法以及基于视觉注意力的细粒度图像分类算法。这些算法有一个共同的特点就是学习具有判别性局部区域的细粒度特征,只有抓住这些易于与其他子类区别的精细的图像特征才能高效地区分不同的细粒度图像。因此,我们的研究目标是在不使用额外的边框或局部注释的情况下实现对于细粒度图像不同子类的有效区分。为了实现这个目标,我们需要对图像中具有判别性的区域进行定位并学习其更为精细的图像特征。在本文中,我们凭借图像级标签对细粒度图像分类的方法进行了探索,主要的工作内容如下:(1)针对细粒度图像数据集类内差异性大和类间相似度高的特点,我们提出了基于特征选择的细粒度图像分类方法。该方法通过融合不同感受野的有效信息来提升特征图的质量。为了筛选出具有判别性的特征,对不同尺度的局部区域进行打分,并提取具有判别性局部区域内部更为精细的图像特征进行分类。利用提出的损失函数帮助我们的模型定位具有判别性的图像特征,不仅解决了类内差异性问题,还能减少在特定样本上的过拟合,从而解决了类间相似性问题。我们在三个广泛使用的细粒度图像数据集上进行了实验。实验结果表明,我们的方法能够提升细粒度图像的分类精度并实现较为优越的分类性能。我们还可视化了用于细粒度图像分类的判别性区域,它表明我们的模型能够有效地捕捉子类间细微的差异,从而实现不同子类的有效区分。(2)不同尺度细粒度图像特征能为细粒度图像分类提供图像中不同层次的信息,而这些不同层次的信息能为细粒度图像分类任务提供更为丰富的决策依据。因此,我们设计出了基于多尺度特征融合的细粒度图像分类方法。具体来说,我们对具有辨识度的区域进行更精细的局部定位,找出易于与其他子类区分的更为精细的图像特征,比如鸟类头部的喙。之后,对不同尺度的细粒度图像特征进行权重约束,使得我们的模型着重关注图像中判别性特征信息丰富的关键局部区域。与其他经典的细粒度图像分类方法相比,我们的方法实现了分类精度的有效提升。这说明我们的方法不仅能够实现判别性区域的高效定位,还利用不同尺度细粒度特征信息来修正模型最终的分类结果,进一步改善了细粒度图像的分类性能。
其他文献
创新是一国社会发展的根本动力,而企业是国家科技创新体系中的关键一环。但由于企业的创新面临着较大的代理问题与融资约束,企业的创新投入强度往往处于一种低水平。以往学者对企业创新的研究,多数是由企业的外部宏观环境或内部治理特点出发,少有学者研究企业行为对企业创新活动的影响。而事实上,企业履行社会责任的行为会影响到企业的综合绩效,可在一定程度上缓解代理问题,为企业提供融资便利。理论角度看来,企业通过履行社
目标跟踪是计算机视觉和多媒体领域重要的分支。目标跟踪的任务是在一段视频中持续定位跟踪某一个或多个目标,在道路监控、人机交互、遥感影像分析等众多领域有着广泛应用。尽管研究学者们在目标跟踪领域取得了丰硕的成果,但是它依然是一个富有挑战性的课题。在自然场景中,有大量的因素困扰着目标跟踪算法的性能,包括目标形变、光照变化、部分或完全遮挡、背景杂乱等等。近年来,基于超像素的目标分割与跟踪算法已经被广泛应用于
科学数据是现代科学研究的重要组成部分,作为科研活动的主要成果和重要推动力,对科学技术的创新有着不容小觑的作用。科学数据重用可以对已有的数据资源进行有效地开发和利用
“民以食为天,食以安为先”,食品安全问题关系人民群众的切身利益,而农产品质量安全是食品安全的第一道屏障,不仅关系到公众的生存和发展,还影响到一个地区和国家的经济、政
企业内部考核是当今企业界的一个重大研究课题,现行国内连锁经营企业的内部考核体系存在着很多缺陷。在企业内部建立内部考核体系的主要目的是为了提高企业的运作效率,使企业
图像视频生成是一种将源人物转换为给定任意目标姿势的合成图像/视频技术,其中目标人物的外观和纹理与源人物保持一致。图像视频生成可以应用在互动娱乐、影视特效合成、时尚造型设计以及图像/视频数据集增强等广泛场景。然而,在图像生成技术中,目前的生成方法通常会忽略人物图像的详细外观和纹理信息,模型复杂且难以训练。现有的视频生成算法未考虑到视频背景环境对人体姿态估计精度的影响,以及背景在运动转移研究范畴中的结
自2010年3月31日开始,中国证监会开始逐步放松卖空管制,股票市场允许特定试点股票进行融券卖空,中国正式进入可以双边交易的时代。本文以此为研究背景,基于上市公司的经验背景,通过准自然实验分析,研究卖空管制放松与企业并购绩效之间的关系。具体来说,本文采取双重差分模型(DID)的实证研究方法,以2007年至2017年我国上市公司并购交易事件的数据作为初始研究样本,对卖空管制放松下的企业并购绩效影响进
区域竞争力是当代区域经济研究的新课题。它将所研究的对象(区域)置于一个更大的范畴(大区域)中,应用比较经济学的方法和经济竞争原理进行比较分析,判断其相对优劣势,进而制
在国家大力推进“全民阅读”,构建“学习型”社会的背景下,全国各地的图书馆都顺势开展了多种多样的阅读推广活动。受“互联网+”浪潮的影响,国民数字化阅读方式的接触率持续
猫疱疹病毒Ⅰ型(Feline herpesvirus 1,FHV-1)属于疱疹病毒科(Herpesviridae)甲型疱疹病毒亚科(Alphaherpesvirinae)水痘病毒属(Varicellovirus),是猫病毒性上呼吸道疾病的主要病原体