【摘 要】
:
视觉显著性检测旨在检测出给定图像中人类感兴趣的目标区域,被广泛应用于图像理解、图像检索等领域。随着深度学习的发展,如何设计有效的模型以及损失函数成为显著性检测研究
【出 处】
:
中国科学院大学(中国科学院计算机科学与技术学院)
论文部分内容阅读
视觉显著性检测旨在检测出给定图像中人类感兴趣的目标区域,被广泛应用于图像理解、图像检索等领域。随着深度学习的发展,如何设计有效的模型以及损失函数成为显著性检测研究的关键问题。本文关注于RGB和RGB-D两种模态下的显著性检测,分别提出了两种模型。在多个数据集上的定量和定性实验验证了这两种算法的有效性。针对当前图像显著性检测存在的若干问题,如简单的特征融合方式,本文提出了全局上下文感知的渐进聚合网络(GCPANet)。首先,考虑到不同层次特征的特性,本文设计了一种简单而有效的方式即FIA(Feature Interweave Aggregation)来聚合低层次、高层次的特征和全局上下文信息;在解码器阶段,通过并行的方式引入全局上下文信息,以期通过捕获不同显著性区域之间的关系来提升显著性物体的完整性和减缓特征稀释的影响。在6个数据集上的实验结果表明,该方法优于当前的12种先进算法。此外,我们注意到,仅依靠单一模态即RGB图像信息进行显著性检测会受到如表观相似的干扰。因此,引入深度信息辅助RGB信息成为本文的下一个研究点。关注RGB-D的显著性检测,本文提出了深度潜力感知的门控注意力网络(DPANet),旨在解决两个问题,即如何避免不可靠深度图的污染和如何有效地融合RGB信息和深度信息。针对不可靠深度图的污染,本文首次显式地建模了显著性检测导向的深度潜力感知,以评估深度图的潜力和削弱污染。为了高效地聚合RGB信息和深度信息,本文利用门控单元和注意力机制设计了GMA(Gated Multi-modality Attention)模块,以跨模态的视角捕获空间上长距离的依赖。GMA模块旨在增强特征对显著性区域的响应,同时自适应地调节跨模态信息的融合比例。最后,通过多尺度特征融合和多模态特征融合来产生具有判别力的特征和最后的显著性预测图。在不借助预处理技术如HHA或后处理技术如CRF的情况下,该算法在8个数据上的性能超过当前的15种先进算法。
其他文献
本翻译实践报告的原文是《欲望号边车:大作家与酒》中的第五章和第六章。这本书由Dey Street Books出版公司于2018年11月13日出版,作者为格雷格·克拉克和蒙特·波尚。该书主
阮咸是我国传统抱弹有品类乐器的源头之一,如今所使用的阮咸是以其汉代前身为基础,融合现代科学方法加以复原、改革而来。古代阮咸在周边地区的多元民族文化影响下孕育产生,而现代阮咸的发展同样离不开曾赋予其生命力的、多彩的民族音乐元素。本文以探析阮咸演奏中的蒙古族音乐风格为核心,从笔者的实践经验出发,通过查阅有关资料以及实例分析等方式,对阮咸的起源、阮咸作品中的蒙古族音乐风格、以及蒙古族风格音乐元素在演奏及
自由空间光通信(Free Space Optical Communication,FSO)系统是指以激光光波作为信息载体,以自由空间作为信息传输媒介的通信系统。捕获(Acquisition)、对准(Pointing)、跟踪(Tracking)(APT)系统是自由空间光通信系统的重要组成部分,为适应自由空间光通信系统小型化、一体化的发展需求,APT系统使用一个光电探测器代替原来的粗跟踪和精跟踪探测器
四川清音作为四川优秀的说唱艺术曲种之一,形成于清代乾隆年间,是南北文化与四川语言、戏曲声腔,民间故事长期融合与碰撞的产物,曾经大街小巷妇孺皆知,盛极一时。表演方式由演唱者自击自唱----左手击板,右手击鼓的表演形式,是四川乃至中国传统艺术的重要组成部分,在2008年被评为国家第二批非物质文化遗产。四川清音有三大演唱技巧“哈哈腔”、“贯口”、“弹舌音”。本文所讲的《小放风筝》即是一首小剪剪花调,讲诉
随着电子监控,手机摄影,图像识别,人工智能的飞速发展,实际应用对成像系统提出了更高的要求,光学成像系统朝着微型化,紧凑化,集成化方向发展。传统的光学成像系统通常采用透镜组成像,镜片数多,体积大,结构复杂,难以实现与各种小型化系统的集成和融合。人们受到自然界中天然复眼的启发,在微透镜阵列发展的基础上,研究仿生曲面复眼,曲面复眼的视场角大,景深大,结构紧凑,在高速移动的物体信息捕捉方面有很高的灵敏度。
随着综合国力的不断提升,我国航天事业取得巨大成就。研制出的大型精密光学仪器的型号不断增多,对航天产品的装配精度也提出了更严格的要求。这些仪器往往具有重量大、精度高、调整过程复杂等特点。目前,产品的装配任务主要依靠人工操作,装配周期、精度及可靠性与操作人员的经验有较大的关系。因此,将大型工业机器人引入航天制造领域,发展高精度的自动化装配技术,能够实现航天装备的高精度和可靠性,是解决航天产品高精度装配
在上世纪八九十年代的中国文坛,二月河是最具代表性的作家之一。其历史小说以大量史实为依据,通过无与伦比的艺术才华进行加工,迅速形成了一股二月河热。不仅其小说作品一版
同宗民歌的概念,是指在民歌母体的基础上,通过改变及歌者的二度创作,由一个源头流传至全国各地,与当地语言风俗相结合后演变出来的民歌变体。同一民歌的变体与当地的民歌风格和方言有着密切的关系,所以大多以母体民歌为基础,采用依字行腔的方式,冯光钰先生将同宗民歌分六个种类,在这里《放风筝》则属于同宗民歌分类的第一种:词曲大同小异的类别。在《中国民间歌曲集》中,总计收录了79首地方民歌《放风筝》。由此可见,每
在国防与航天等领域中,为了观测弹丸与航天器等目标的高速瞬态变化过程,必须使用高速相机采集记录高速过程,事后进行回放和处理。随着科学技术的发展,研究对象的运动速度大幅提升,对高速相机的分辨率、拍摄帧频以及成像质量提出了更高的要求。当前具备实时传输功能的高速相机很少具备图像预处理功能,且成像分辨率和帧频需要进一步提升,因此文章选用LUXIMA公司生产的LUX13HS传感器,提出一种能够对图像进行预处理
研究背景卵巢癌是困扰女性生殖健康的主要恶性肿瘤之一,发病率在发达地区显著高于欠发达地区,并且在全世界范围内有逐渐升高的趋势。卵巢癌易复发、易转移,其致死率位居所有