【摘 要】
:
细粒度图像分类(Fine-Grained Visual Categorization,FGVC)任务是对大类下的子类进行分类,比普通图像分类任务的粒度更为精细。蔬菜和水果识别可以看作是一项细粒度图像分类任务,由于类内方差大、类间方差小,并受遮挡、背景、视角等因素的影响比较大,因此非常具有挑战性。解决这一难题的主流方法是利用细粒度局部或全局特征来增强学习过程中的特征提取和表示。然而与人类视觉系统不同
论文部分内容阅读
细粒度图像分类(Fine-Grained Visual Categorization,FGVC)任务是对大类下的子类进行分类,比普通图像分类任务的粒度更为精细。蔬菜和水果识别可以看作是一项细粒度图像分类任务,由于类内方差大、类间方差小,并受遮挡、背景、视角等因素的影响比较大,因此非常具有挑战性。解决这一难题的主流方法是利用细粒度局部或全局特征来增强学习过程中的特征提取和表示。然而与人类视觉系统不同的是,大多数现有的FGVC方法在训练期间仅仅从单个图像中提取特征。相比之下,人们可以通过比较两张不同的图像来更好地学习辨别特征。传统的Attentive Pairwise Interaction Network(API-Net),将图像对作为成对特征交互的输入,在几个开放的FGVC数据集中显示出优异的性能。然而,在蔬菜和水果领域的FGVC数据集VegFru上,API-Net的准确性却低于预期。通过对细粒度问题的分析,本文提出了一种基于注意力感知交互特征网络(AIF-Net)的FGVC框架,设计了完整的网络结构,在几个特定的蔬菜数据集上进行训练与测试实验,最后采用实际的数据图片进行实验验证。本文提出的基于注意感知交互特征学习的细粒度果蔬分类的人工智能算法(AIF-Net)创新之处在于:(1)提出了一种新的基于注意力机制的细粒度果蔬分类算法,该算法减少了细粒度图像因多尺度、复杂的背景信息等大量非相关信息进入训练过程的影响,聚焦关键信息位置,产生更具分辨性的特征表示,有效地增强了网络提取目标主体特征的能力。(2)融合了区域建议网络,构建形成新的网络结构。把含信息量多的局部区域特征和全局特征融合,进行交互式特征学习以生成高质量的细粒度特征。(3)优化了 API-Net损失函数,通过自适应地考虑特征优先级来学习图像对和局部区域中的每张图像,更好地优化底层神经网络。实验结果表明,在Veg200、Fru92和VegFru292三个数据集中,AIF-Net从区域建议网络提取三个局部区域,并和全局特征做串联融合操作,最后得出的Top-1准确率最高,分别为 89.087%、91.032%和 90.756%。在 VegFru292 数据集上,Top1 和 Top5 的准确率表现最佳,分别以3.515%和0.771%的精确度超过了 API-Net。本文所提出的AIF-Net通过结合全局和局部注意力特征图进行交互式特征学习,具有较好的辨别能力。
其他文献
我国正进入云计算、物联网、大数据、人工智能、5G应用和实体经济深度融合的新业态新模式发展阶段,党的十九届五中全会提出要坚定不移建设网络强国、数字中国,深入推进数字化转型,加快数字化发展。数字化发展成为通信运营商发展的新方向,加快实施数字化战略,不仅是通信运营商顺应国家供给侧改革和“新基建”落地实施的必然要求,也是加速企业自身的新兴业务与传统业务深度融合,形成新能力、奠定新地位的重要举措。论文以中国
氦气被誉为“金气”,目前已被广泛地应用在低温科学研究、医疗器械、航空航天等尖端工业领域。随着这些技术的飞速发展,全球对氦气的需求急剧增长,但由于全球氦储量十分有限,供求不平衡的现状造成了氦气资源的持续短缺。富氦的天然气是最容易获取氦的资源,但现有的分离方法效率低、能耗高,这使得亟需探究高效环保的氦气分离方法。另一方面,氢气作为一种可再生的、生态清洁的能源,在许多化学工业,如燃料电池制造、化学氢化、
双曲材料(HM),又被称作不定介质,是一种独特的光学材料,具有强烈的各向异性特征,其介电常数张量的分量具有不同符号,因此导致了其色散等频面是波矢空间中的双曲面,双曲材料的名字也因此而来。由于正负介电常数分量的存在,双曲材料可以在不同偏振光的激发下表现出金属特性或者电介质特性。双曲材料中独特的色散曲线使其具有承载高度局部化的等离激元和定向表面电磁波的能力,在许多需要较大波矢量的应用方面有重要地位,比
A公司作为一家以服务海外金融机构为主营业务的软件服务商,在管理方式上,仍主要使用传统的瀑布式开发管理模式。在进入新国家或地区时,由于缺少相关国家及地区的政策、经验及产品的积累,因此,项目常常面临需求不明确的情况。加之传统的瀑布开发模式各环节层层递进,因此,由需求变更产生的滚雪球效应难以控制,从而产生项目进度无法把控、质量不达标、客户及项目团队双方都觉得事倍功半、团队气氛差等问题。面对瀑布开发带来的
宽禁带氧化物半导体WO3具有优异的光学和电学特性,在电子信息、传感器件、智能窗口等领域有广阔的应用前景。不同的应用对其性能有不同的要求,因此,对WO3物性的可控调控一直是物理、化学等相关学科研究的热点。通过外加电场对器件的电、光等物性进行连续可逆的调控是一种广泛应用的调控手段。外加电场可通过静电相互作用改变薄膜沟道中的载流子浓度,进而对器件的性能进行改变。这种调控方式是易失的,当撤去外电场后器件的
随着金融科技的快速发展,中国人民银行发布的《金融科技三年发展规划》阐述了金融科技对增强金融服务质量和效率有重要意义。随着我国经济发展进入“新常态”,在银行不良率上升的环境下,中小银行越来越重视金融科技在风险管理领域的建设与应用。在快速变化的市场环境中,对于该领域的金融科技公司来说充满了机遇与挑战,因此制定适合自身发展的竞争战略变得尤为重要。LM公司作为山东省内金融科技行业重要企业之一,为省内中小银
最近几年世界各国开始关注全球变暖问题,全球变暖的主要原因在于温室气体的大量排放,其中主要以二氧化碳的排放为主,因此全球很多国家对二氧化碳排放开始进行全面控制,主动担负责任。作为全球碳排放大国,中国也承担起了相应的减排责任,并提出了“碳达峰”、“碳中和”的时间表和行动计划。因此,如何通过碳交易管理实现我国碳排放管理具有特别重要的理论与现实意义。随着我国碳交易试点逐步运行成熟,涵盖电力、水泥、钢铁、化
股票质押信贷业务是出质人以持有的上市公司股票为质押而从资金方获得融资的信贷行为。因其拥有交易灵活、操作简便等优势,受到资金方与融资方的青睐,逐渐成为金融市场上解决企业融资难问题和服务实体经济的重要方式之一。尽管股票质押业务市场整体风险在近几年有所缓释,然而个股爆仓风险依旧存在,资金方对于股票质押业务的信贷风险管理更加重视。在上述背景下,本文以全面风险管理理论、信息不对称理论为基础,选取国有企业RY
海洋中藻类的分布、含量以及时空上的动态变化是研究海洋初级生产力水平、富营养化等科学问题的基础。随着人类城市化进程的加快,大量废水的排入使海洋中赤潮等现象频繁爆发并趋于常态化。各国海洋工作者正寻求有效的海洋生态环境监测方法,以更好的为海洋管理提供策略和早期预警。目前叶绿素a的浓度及其时空分布可以反映藻类生长状况和海洋初级生产力水平,也是监测和预警赤潮现象最直接的指标。因此,研制高精度、实时、可长期监
城市的发展推进了现代化的进程,现代化带来的生态问题也必然会体现在城市发展中,城市面临的生态危机正向人类发出挑战。长期以来,我国城市生态环境建设在理论与实践中都积累了一些问题,生态环境建设成效并不稳固,各类城市生态环境问题直接刺激着人民群众的各种感官,影响着人民群众的生产活动、生活质量和生命安全,也影响着人民群众对党和政府的评价。马克思主义理论是中国共产党治国理政的指导思想,恩格斯生态文明思想作为这