基于判别性区域和多特征融合的场景识别研究

来源 :南昌航空大学 | 被引量 : 0次 | 上传用户:zth123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
场景识别是计算机视觉的一个重要研究内容,主要是识别图像或视频中的场景类别。场景识别在自动驾驶,机器人和虚拟现实等领域有着广泛的应用,因此成为目前的研究热点。随着互联网技术的普及,获取场景图像数据越来越容易,但人们只关心图像的语义内容,因此急需场景识别等技术提供图像的语义内容。场景识别算法大致可以分为两种:传统的场景识别算法和基于深度学习的场景识别算法。传统的场景识别采用基于图像底层的特征,已经出现瓶颈。深度学习方法从海量数据中学习,不需要人为干涉,且学习到的特征具有语义信息。目前,场景识别技术已经比较成熟,但还存在很多难点有待解决。其中,对识别结果影响最大的是场景图像的类内差异性和类间相似性。基于深度学习的场景识别算法在选取特征时只考虑了高层的语义特征,没有使用低层的细节特征,导致提取的特征鲁棒性不强,影响识别结果。针对以上难点和问题,本文在深入研究国内外相关场景识别算法后,提出了两种基于深度学习的识别算法用于解决以上问题:(1)针对场景的类内差异性和类间相似性问题,本文提出了一种基于弱监督注意力图的方法用于寻找场景图像的判别性区域,即类别的代表性区域和类间的差异性区域。受深度学习可解释性的工作启发,首先利用卷积神经网络和弱监督信息为场景图像产生注意力图;接着再利用注意力图的信息为场景图像产生判别性区域;然后提取判别性区域的特征,这样可以有效减少背景和类间相似性区域的干扰;最后进行特征编码,融合全局特征,得到图像表征。在MIT indoor 67、Scene 15和UIUC Sports场景图像数据集上进行实验,本文算法都取得了不错的效果。(2)针对提取特征的鲁棒性不强的问题,本文融合多层卷积特征为场景图像得到更加鲁棒的特征。首先利用区域生成算法为场景图像产生可能包含物体的区域,这样可以避免背景的干扰;接着将每个候选区域相应的特征图进行自适应池化,得到相同长度的特征向量;然后为每层的特征向量进行编码;最后进行特征融合,并且结合全局特征,形成图像最终的表征。在MIT indoor 67、Scene 15和UIUC Sports三个基准数据集上的实验表明,本文方法取得了不错的识别效果,分别获得88.05%、95.03%和98.20%的准确率。本文方法识别准确率很高的原因,主要归功于融合了高层的语义特征和低层的细节特征。
其他文献
超声检测是无损检测领域里应用较为广泛的一种检测手段。随着国家对质量要求的日益严格和现代无损检测技术的快速发展以及较复杂构件的增多,科研人员利用雷达的原理研究出超声相控阵检测,并在多个领域发挥不可替代的作用。为了使相控阵检测的具有可靠性,需要对相控阵超声检测仪的性能进行测试。目前是通过相控阵检测仪自身的成像系统进行测试,但是相控阵检测仪自身的成像方法不是真正的声波。为了能够直观的看见超声波,实现相控
机会网络是一种不需要源节点和目标节点之间存在完整链路,利用节点移动带来的相遇机会实现通信的自组织网络,其中消息在节点间以“存储-携带-转发”的形式进行传输。链路预测是机会网络研究中的热点和难点之一,链路预测目的是利用网络中已知链路和节点属性,评估节点间是否存在链路。优秀的链路预测方法既能发现链路变化规律,又能辅助研究人员进一步了解和分析整网拓扑变化,从而为设计机会网络路由提供理论支撑。针对机会网络
机会网络是一种不需要源节点与目标节点之间存在完整通信链路,利用节点移动带来的相遇机会实现通信的自组织网络。机会网络拓扑变化频繁且无需网络全连通的特性更符合现实组网需求。机会网络中的链路预测是研究难点,链路预测通过已知的网络结构信息和节点属性信息,预测网络中未知的链路。合理的链路预测方法能够挖掘出节点间的潜在关系,帮助人们认识机会网络演化的机制,从而给上层路由协议及相关应用提供支撑。根据机会网络的时
2018年教育大会召开后,高职院校对劳动教育的重视程度空前增加,文章结合高职教育的特点,提出新时代专业育人、文化育人与实践育人三位一体的职业院校劳动教育新模式,旨在通过完善育人体系,将劳动教育贯穿于高职教育人才培养的全过程。
期刊
生物质作为唯一含碳的可再生资源,为实现绿色化学和原子经济提供了契机,其功能化利用对于保障我国能源结构改革和可持续发展具有重要意义。木质素可以先通过解聚反应选择性转化为酚类化合物,然后在加氢脱氧处理下转化为液体燃料、高价值化合物中间体,这是提高木质素利用率的重要途径。现有催化剂常面临失活、选择性低等问题,硫化催化剂甚至会对环境造成污染。非贵金属在本质上具有较低的催化活性,构建高效的非硫化非贵金属催化
天然气管道尤其是小口径管道是城市燃气管道网的重要组成部分,是输送天然气的重要运输手段,具有广泛的应用前景。由于化学腐蚀、管道内部疲劳及老化等问题,管道爆裂事故频频发生,故对天然气管道开展无损检测具有重要意义。阵列涡流检测技术具有检测范围广、适应性强等优点,能够有效实现小口径天然气管道内壁缺陷的检测。本文从涡流检测理论出发,建立了基于ANSYS的天然气管道三维有限元模型,研制并优化了FPCB阵列涡流
森林火灾的发生给我国丰富的森林资源带来了严重威胁。随着嵌入式技术和图像处理技术的日益发展,如何利用新的森林火灾检测技术来代替人工巡逻、瞭望塔监测等传统而低效的林火检测手段已成为了当前的研究热点。在此背景下本文设计并实现了一款集视频图像采集、烟雾识别、图像压缩和网络传输于一体的嵌入式烟雾识别林火检测装置。本文的主要研究工作如下:(1)嵌入式烟雾识别林火检测装置总体设计。首先,对整个嵌入式林火检测系统
撑杆跳高运动源于体操项目,经过不断发展演变为田径项目。1896年被列为奥运会比赛项目,随着我国经济飞速发展撑杆跳高运动在我国发展水平也不断提升。自2008年北京奥运会后我国在撑杆跳高发展情况上有显著上升,撑杆跳高运动水平不断提高涌现出诸多优秀的运动员,在世界级的比赛中崭露头角。安徽省撑杆跳高运动员不论是在技术方法还是运动水平都处于全国领先地位。文章通过对安徽省撑杆跳高目前发展现状进行深入分析与探讨
近年来,钙钛矿材料由于吸收系数大、带隙可调、高亮度、高色纯度、宽色域、较高的缺陷容忍性和制备方法简单等独特而优异的光电性能而受到人们的广泛关注。钙钛矿材料已被广泛应用于太阳能电池、发光二极管、激光、X射线成像和光电探测器等各领域。值得注意的是,经过近几年的发展由钙钛矿材料制成的发光二极管外量子效率已超过20%。然而钙钛矿材料存在的稳定性问题,尤其是对水、光、热、氧和有机溶剂等因素的敏感性大大限制了
随着微电子、无线通信等技术的飞速发展,无线传感器网络技术得到了广泛的应用与研究,逐渐融入到人们生活的各个领域中,改变了人们与物理世界的交互方式,提高了人们认识和改造物理世界的能力。无线传感器网络是由部署在特定区域的大量微传感器节点组成,传感器节点能量受限且难以补充,因此,如何设计高效节能的路由算法来延长网络的生命周期,成为无线传感器网络研究的热点。移动代理技术是一种新型分布式技术,相比于传统的客户