基于双线性CNN的细粒度图像识别模型研究与实现

来源 :宁夏大学 | 被引量 : 0次 | 上传用户:chiyulong2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现代工业和科技水平的不断提高推动着社会经济的发展,然而,由此衍生的工业污染问题却给人类生态文明建设和物种多样性保护带来了严峻挑战,许多野生动物的生存环境遭到污染和破坏。我国是世界上鸟类最多的国家之一,拥有超过1400种野生鸟类,因此,野生鸟类的监测识别与保护问题显得尤为重要。传统鸟类识别一般通过人工值守并借助相关专业人员逐一鉴别的方式进行,很难兼顾高效性和准确性。随着现代人工智能技术的快速发展,人们通过无人机等航拍设备采集野生鸟类图像,再利用细粒度图像识别算法进行无人化监测识别已成为一项新的研究热点。这种细粒度图像识别方法不仅能够节省时间和人力成本,还能带来良好的社会效益、推动科学的发展,具有非常重要的研究价值和意义。细粒度图像识别不同于一般的图像识别研究任务,它旨在对同一大类物体下的不同子类对象进行更精细的划分。常见的细粒度图像识别研究对象涵盖了如鸟、狗、汽车、飞机、花卉、植物等多种物体,这其中以鸟类识别为代表。鸟类识别最能体现细粒度图像识别的研究特点与难点,因此受到了国内外研究人员的广泛关注和参与。本文围绕面向野生鸟类的细粒度图像识别方法展开研究,首先对细粒度图像识别的研究现状和研究方法进行全面分析,采用双线性CNN这一具有代表性的细粒度图像识别模型进行鸟类识别研究工作,并针对双线性CNN模型特征学习阶段的部分问题进行分析,进一步提出模型改进策略和方法。本文通过引入深度残差学习结构和视觉注意力机制的方法,提出了一种融合二元残差注意力模块的改进双线性模型BRAN,利用深度残差网络强大的特征提取能力和多维度注意力特征融合的方法有效提升了原模型在细粒度图像识别问题上的效果。该模型在细粒度图像基准数据集CUB-200-2011上的分类准确率达到了 87.2%,不仅提升了原双线性CNN模型在该数据集上的识别效果,也超过了近年来一些主流细粒度图像识别算法的分类准确率。最后,本文还对改进后的模型进行系统封装,设计并实现了一个基于Web平台的细粒度鸟类图像识别系统。
其他文献
金融波动率序列的建模和预测一直是学术界研究的热点,也是金融市场关注的核心问题。金融波动率序列的重要特征之一即自协方差系数缓慢衰减,关于这一特征产生原因,主流的解释是数据生成过程为长记忆或结构变点。然而,针对不同的数据生成过程,预测策略的表现是不尽相同的。本文针对只单独存在长记忆或结构变点的情况和长记忆与结构变点共存的情况,分别提出预测方法。针对前者,本文采用基于判别检验的预测方法,针对后者,本文提
清代是中国最后一个封建社会朝代,也是旧中国茶叶对外贸易的鼎盛时期。其中中美茶叶贸易是中国对外贸易的一个重要部分。自独立建国开始,美国便展开了对华贸易,到清代末期,茶叶始终占据中美贸易的核心商品地位。研究中美茶叶贸易,有助于我们认识清代茶叶对外贸易的发展特点及影响因素,了解中美早期的贸易往来。本论文主要分为四大部分,将清代中美茶叶贸易整体分为三个阶段探讨,分别为兴起阶段、繁荣阶段和衰落阶段。具体围绕
弛豫铁电单晶由于其优异的性能引起了铁电研究领域的研究热潮,其中三元系弛豫铁电单晶Pb(In1/2Nb1/2)O3-Pb(Mg1/3Nb2/3)O3-Pb Ti O3(PIN-PMN-PT)和Mn掺杂的PIN-PMN-PT(PIN-PM
流体力学是力学的一个分支,它是研究流体现象及相关力学行为的科学,它根据不同的”力学模型“分为理想流体力学、可压缩流体力学、非牛顿流体力学等.如今,非牛顿流体力学已经发展成为基础科学体系的一部分,因此对非牛顿流体的研究是很有必要的.近年来,由于科学技术的迅速发展,非牛顿流体的研究和应用越来越重要.除数学领域,非牛顿流体在我们的日常生活中也十分常见,比如人身上的血液、淋巴液等多种体液,化学上应用的泥浆
市场经济的快速发展在公司中催生了关联交易这一新的交易形式。对于关联交易,我们应当一分为二地看待,一方面,它能够提高交易的效率和效益,使公司以较低的时间和金钱成本实现
自改革开放以来,消费低迷与内需不足一直都是困扰中国经济结构升级与持续增长的难题。与之形成鲜明对比的是,随着中国经济的发展,收入差距大有愈演愈烈之势,本文认为现如今日益扩大的收入差距是造成消费低迷的主要原因之一。中国对于造成居民消费低迷原因的研究汗牛充栋,而大多数研究只涉及消费者自身的有关因素,忽略了中国居民消费的非独立性与存在着周期性消费高峰的特点。现有的涉及收入差距影响居民消费的研究,在实证研究
多相流流动特性的参数检测和研究已经成为多相流问题的研究重点,其普遍存在于人们的生活和工业生产中。在石油天然气的开采过程中,随着油藏的不断开发,在开发过程中控制石油天然气的出油量和出气量尤为重要。在开采过程中,实时的监测输出量,可以对油气井在不同阶段的开采进行定量评价,制定更优化的开采方案。其中,石油气在管道中的流动形态从宏观意义上属于气液两相流的流动形态,两相流的流动特性研究作为多相流检测中的基础
自我控制对促进大学生的身心健康发展及良好的社会适应等都有重要的意义,培养良好的自我控制能力是高等教育面临的现实问题。自我控制能力受诸多因素的共同影响和制约,哪种方
随着我国经济的蓬勃发展,我国的体育产业也随着国际趋势在慢慢崛起。职业体育在上世纪九十年代,以职业足球改革为契机,开始进入了中国的历史长河,作为职业体育基本单位的职业
随着三维重建任务在智能制造、安防监控、智能驾驶、视频交互、医学诊断、机器人等领域的需求日益增加,从图像中实现三维重建的研究意义及价值得以体现。基于图像三维重建旨在从单张或多张图像中推理出人脸、物体或者场景的三维模型,但由于自然环境下的图像受光线、遮挡、拍摄角度、空间信息模糊等客观因素影响,给重建工作带来了极大的挑战。三维重建算法从最初研究三维到二维投影,到如今利用深度学习技术重建,重建效果得到了很