细粒度图像分类的深度学习方法

来源 :计算机科学与探索 | 被引量 : 0次 | 上传用户:gogl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
细粒度图像分类旨在从某一类别的图像中区分出其子类别,通常细粒度数据集具有类间相似和类内差异大的特点,这使得细粒度图像分类任务更加具有挑战性。随着深度学习的不断发展,基于深度学习的细粒度图像分类方法表现出更强大的特征表征能力和泛化能力,能够获得更准确、稳定的分类结果,因此受到了越来越多研究人员的关注和研究。首先,从细粒度图像分类的研究背景出发,介绍了细粒度图像分类的难点和研究意义。其次,从基于强监督和弱监督两个角度,综述了基于深度学习的细粒度图像分类算法的研究进展,并介绍了多种典型的分类性能优秀的算法
其他文献
针对物流配送领域的一种新型交付方式——无人机联合配送车协同配送包裹,研究无人机与配送车联合路径以最小化交付时间的问题,提出了一种新型优化迭代算法。该算法将问题分为两步,首先确定配送车路线及客户节点分配,然后固定配送车路线及无人机节点,确定二者汇合节点生成无人机配送路线。算法最后保留满足约束条件的无人机路线及对应配送车路线,得到联合配送总耗时。以此方式从最少的配送车节点开始迭代,通过更新全局上界得到
新型冠状病毒肺炎(COVID-19)大流行疾病正在全球范围内蔓延。计算机断层扫描(CT)影像技术,在抗击全球COVID-19的斗争中起着至关重要的作用,诊断新冠肺炎时,如果能够从CT图像中自动准确分割出新冠肺炎病灶区域,将有助于医生进行更准确和快速的诊断。针对新冠肺炎病灶分割问题,提出基于U-Net改进模型的自动分割方法。在编码器中运用了在ImageNet上预训练好的EfficientNet-B0
通过预约缓解集装箱码头拥堵是提高港口运作效率的有效途径。考虑集卡公司和码头运营商双方的利益以及码头内部作业系统的复杂性,以减小外集卡在预约时间窗内的平均排队长度和集卡公司期望到达的预约时间窗与被调配到的预约时间窗间的差异为目标,运用排队论相关知识和逐点固定流体近似方法(PSFFA),建立了多目标规划模型,以确定一个使集卡公司和码头运营商双赢的集卡调度计划。引入实例数据,利用CPLEX求解模型,并将结果与蒙特卡罗仿真结果作比较,以验证模型的有效性,并在此基础上调节参数优化预约模式。算例结果表明,集卡预约多目
针对NSGA-II算法在处理车间排产优化问题中出现的子代种群多样性差、收敛能力差等问题,提出了一种改进NSGA-II的车间排产优化算法。改进NSGA-II算法主要对传统NSGA-II算法的交叉和变异环节,提出新的改进自适应交叉和变异算子,通过对个体拥挤度与种群平均拥挤度进行对比,并结合种群迭代进化过程,将遗传概率与种群个体及种群进化迭代次数关联,避免盲目导向性,提高种群的收敛速度;提出新的均匀进化精英保留策略,通过自适应分层次选取种群个体,解决子代种群多样性差的问题。针对车间排产问题,选择“最大化最小交货
绿色港口日渐成为港口发展的必然趋势,为了提高集装箱码头的服务水平及降低其能耗,综合分析了集装箱码头的装卸作业流程,考虑岸桥、场桥、集卡在不同作业状态下的能耗,且以总完工时间和总作业能耗最小为目标建立了多目标混合整数规划模型。使用MATLAB编码改进自适应遗传算法求解所建模型,并分别与CPLEX和原始遗传算法的求解结果作对比,证明了该算法的优秀性。更改能耗目标和作业时间目标所占权重进行求解,发现考虑各设备在不同作业状态下的能耗会影响总完工时间,且能耗与作业时间是相互冲突的目标,追求低能耗会造成作业效率的牺牲
大数据时代,数据蕴含着巨大价值,成为当今信息社会的重要战略资源。然而,在对数据进行加工、处理的过程中,产生了大量不一致数据,对企业决策造成了不可预知的恶劣影响。现有的工作主要基于函数依赖研究数据修复技术,已有的修复方法分为三类:前两类需要企业提供Master数据库或给定元组的可信度值,然而在实际应用中,这样的条件未必能满足;而第三类基于最少删除原则的修复方法又会造成信息的丢失。同时,当函数依赖X→Y存在冲突时,现有的方法仅支持修改Y属性值。针对以上不足,在没有给定元组可信度的情形下,提出了带有可信度标记的
刑侦工作中,若犯罪嫌疑人的人脸图像存在遮挡,人脸特征点遭到破坏,精确去除遮挡区域成为提高人脸识别技术的重要一步。因此,人脸去遮挡有着重要的研究意义。对人脸去遮挡技术最新进展进行阐述,并基于2016年首次提出的基于深度学习图像修复算法,介绍从2017年至今学者们提出的各类人脸去遮挡融合算法。首先根据遮挡方式的不同将现有算法分类为随机遮挡和规则遮挡的人脸修复,接着根据算法中预测生成网络的不同,进一步分
近年来,随着教育信息化的不断深入,海量教育资源和教学数据不断累积,一些教育知识库被提出,这为数据驱动的智慧教育提供了良好的发展条件。基于教育知识库的问答方法能够为学习者提供即时的答疑辅导,进而有效提升学习者的学习兴趣和效率。然而,目前特定于教育领域的知识库问答研究较少,且开放领域的知识库问答方法大多独立地建模问句和候选答案实体,因而建模效果有限。基于此,提出一种基于问句感知图卷积网络的教育知识库问答方法。首先,针对特定问句,提取其中的问句描述信息和查询实体集,并分别通过Transformer和预训练的知识
近年来,卷积神经网络(CNN)凭借强大的特征提取和表达能力,在图像分析领域的诸多应用中取得了令人瞩目的成就。但是,CNN性能的不断提升几乎完全得益于网络模型的越来越深和越来越大,在这个情况下,部署完整的CNN往往需要巨大的内存开销和高性能的计算单元(如GPU)支撑,而在计算资源受限的嵌入式设备以及高实时要求的移动终端上,CNN的广泛应用存在局限性。因此,CNN迫切需要网络轻量化。目前解决以上难题的
知识库(或知识图谱)作为一种对现实世界的有效表征模式,引起了学术界和工业界广泛关注。近年来,随着大规模知识库的出现,知识库问答技术作为知识库的基础应用技术同样备受关注。基于语义解析的代表方法通过对查询句的解析将问题转化为图上的答案检索,但知识库中往往存在缺失的链接,导致上述过程无法顺利开展;基于神经推理的代表模型通过对问题进行编码来进行实体相似度排序,但其无法解决动态场景下的实体冷启动问题。针对上述问题,提出了一种融合子图结构的神经推理式知识库问答方法,实现了在问答推理过程中兼顾实体的语义与结构信息,从而