自适应神经网络的多尺度分析研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:lovezx1990
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能算法的快速发展,在计算机视觉领域中图像分类也往细致方向发展,其中细粒度分类是在粗类别尺度上进一步细分类的子任务,是目前热门的研究方向之一.在细粒度图像识别分类中,类间个体的在判别性特征上有些差异不明显;同时类间特征差异较大,因此该子内容具有类间差异小,类内差异大的特点.在粗粒度分类中,每个类别中所具有的图像样本数量较多,而细粒度类别数据样本少,样本分布不均衡,进一步导致细粒度图像分类分类任务难度增大.基于细粒度分类具有的现实意义与任务难度,本文首先提出自适应多尺度注意力生成机制,在神经网络中利用多尺度注意力图进行特征的软注意力加权,其次使用多尺度注意力图与类激活映射定位待分类目标位置,在训练过程中自适应生成切割图像与遮盖图像,进行自适应数据增强,主要工作如下:1、基于多尺度注意力机制的细粒度分类分析.通过注意力机制可以让模型定位识别图像的判别性区域.首先在神经网络自适应生成注意力的情况下,提出了多尺度注意力生成机制,利用池化后感受野的扩大,融合粗尺度注意力与细粒度注意力,获取不同尺度信息进行软注意力加权.在细粒度图像数据集CUB-200-2011与Stanford Cars上进行数据分析,结果表明,多尺度注意力在参数量没有明显增加的情况下,在两个数据集上细粒度分类准确率相比Res Net18原模型提高了1.7%.2、自适应数据增强的细粒度分类方法分析.为了进一步提高模型的分类效率,本文分别从多尺度注意力生成机制与类激活映射角度,分别生成多尺度注意力图与显著性图,使用显著性图对图像样本进行待分类目标的截取;使用多尺度注意力图对高响应部分进行遮盖,同时用显著性图去除部分背景噪声,提高待分类目标像素点占比.CUB-200-2011与Stanford Cars上的实验表明提出的模型能高效地定位判别性区域,截取高质量图片,实验结果表明该章节模型在两个数据集上与同样进行自适应数据增强的WS-DAN模型准确率提高了1.1%与0.8%,与其他常见的模型准确率均有了1.0%以上的准确率提升.
其他文献
农作物病虫害是农业生产中粮食安全长期存在的隐患,而农药的过度使用将造成过多残留量,将严重影响人的身体健康。随着人工智能在农业的应用越来越广泛,由于人工识别农作物病害带来的效率慢和准确率低等问题逐步得到解决,农业病害发展初期防治的最佳时机成为重要目标。深度学习技术应用到农业病害的识别上取得很好成效,但目前还存在样本不平衡、困难样本分类难等问题。论文针对这些问题,提出几项算法的改进措施并搭建农作物病害
工业机器人已经开始用于物流本包裹分拣业务中,它利用计算机视觉技术实现自动化流水线的分拣模式,自动化水平的不断提升。然而,工业机器人分拣系统在实际使用中,由于分拣类别不同,系统性能要求、分拣精度等方面也存在差异。物流成交量比较高的状态下,极容易出现“错件”分拣、快递分拣速度低等问题,将严重影响快递包裹分拣。本设计对工业机器人分拣系统的性能、功能等方面进行研究,用机械臂代替人工分拣,进一步提升了工业机
当今互联网技术的飞速发展的同时,伴随着海量又杂乱无章的网络信息产生,因此采取有效的信息管理手段是很有必要的。新闻文本作为信息的重要载体,如何对海量的新闻文本进行分类以挖掘出有价值的信息成为当前热门研究课题之一。面对中文新闻文本分类任务,传统的文本表示方法存在无法解决一词多义和不能为文本提供丰富的上下文语义表征等问题。通过文本表示方法获取Embedding表示,在文本特征提取的过程中,文本特征之间缺
随着科学的进步和发展,人与机器之间的联系越来越密切。在计算机的性能不断提升的情况下,人和计算机的人机交流会更加频繁。手势是人机交互的一种方式。手势识别是通过计算机分析每一个手势的具体含义,通过对手势的识别,可以得到人们传递的信息,从中得到的信息可以直观、智能做到人与计算机机之间的交互。研究者们对包括步态、手势、人脸、姿态等交互技术进行了广泛的研究。在这些交互方式中,使用手势交互比较自然,由于其方便
随着基于位置社交网络(Location Based Social Network,LBSN)的兴起,兴趣点推荐成为了生活中不可或缺的服务。因而兴趣点推荐在推荐服务领域中成为了热门的研究领域。在兴趣点推荐中主要面临两个问题,一个是用户对兴趣点评分数据的稀疏性问题。另外一个是用户与兴趣点的特征向量表示问题。传统的协同过滤推荐算法虽然能解决数据稀疏性问题,但是推荐效果并不理想。近年来随着深度神经网络算法
图像超分辨率技术一直是计算机视觉等领域的热门研究方向,其主要任务是将一张低分辨率图像通过某种规则恢复成高分辨率图像。低分辨率图像与高分辨率图像之间的差异中起到决定性作用的并非低频信息,最主要的原因还是在于两图之间高频信息的差距,超分辨率技术即为了复原图像中缺漏的高频信息。随着硬件与机器学习的发展,深度学习的相关研究也逐渐深入地涉足于超分辨率技术领域。自2014年来,基于深度学习的超分辨率技术研究规
聚烯烃弹性体(POE)共混增韧改性是目前多种聚合物材料的主要增韧方法。而POE与高密度聚乙烯(HDPE)共混是目前的POE增韧改性应用的重要方向之一,尤其是在渔具制造行业有广泛的应用。共混过程的流变性能决定了共混物加工的难易和加工窗口的选择。而共混物的结晶结构是决定聚合物材料服役性能的重要因素。共混过程中,组分对共混体系的流变性能和结晶性能的影响不容忽视。对共混体系开展流变性能和结晶性能的研究无疑
生物医用钛合金由于其优越的生物相容性、优良的机械性能以及接近人体皮质骨的低弹性模量而具有广泛的医学应用。Ti-12Mo-6Zr-2Fe(TMZF)合金是一种亚稳态型β钛合金,具有强度高、弹性模量低、耐蚀性能优良及耐磨性能好等特点,是一种理想的人造骨植入物生物材料,且已经得到临床医用方面的许可。本文利用选区激光熔化技术(Selective laser melting,SLM)成功制备了混合粉末下亚稳
泛函微分方程的研究在世界上的许多系统中都发挥着重要作用,其中周期解和同宿轨的课题也一直吸引着全世界学者的广泛关注.本文运用推广的Poincaré-Birkhoff不动点定理和Mawhin延拓定理,对一类泛函微分方程周期解和同宿轨的存在性问题进行研究.全文共分为四章.第一章为绪论,简要介绍了泛函微分方程周期解和同宿轨的研究背景及研究现状,并简述了本文研究的主要内容.第二章运用推广的Poincaré-
软社会问题,如不健康的生活习惯,紧张的人际关系,较低的生活幸福感等,单纯地依靠法律或政策等硬性的干预措施并不足以解决相应的问题。如果设计能有效唤醒公民意识,能主动地调解软社会问题,能将设计思维、工具与方法应用于社会系统,那么这将是设计最大的善意。公益在发达国家,是衡量一个社会发展成熟度乃至社会文明程度的重要指标,也是社会变迁必然不能忽视的重要领域,因为它的背后是在补充一种社会关系乃至社会结构,是在