【摘 要】
:
在卷积神经网络中融入注意力机制越来越成为语义分割强化特征学习的重要方法。论文中提出了一种融合了局部注意力和全局注意力的卷积神经网络。首先,输入图像经主干网络的特征提取,并行输入给局部注意力和全局注意力模块。局部注意力模块以编码-解码结构实现多尺寸的局部特征融合,全局注意力模块根据每个像素与其所在特征图上所有像素的相关性捕获全局信息。融合两个注意力模块不仅减少了局部信息的丢失,而且捕获了具有长距离依
论文部分内容阅读
在卷积神经网络中融入注意力机制越来越成为语义分割强化特征学习的重要方法。论文中提出了一种融合了局部注意力和全局注意力的卷积神经网络。首先,输入图像经主干网络的特征提取,并行输入给局部注意力和全局注意力模块。局部注意力模块以编码-解码结构实现多尺寸的局部特征融合,全局注意力模块根据每个像素与其所在特征图上所有像素的相关性捕获全局信息。融合两个注意力模块不仅减少了局部信息的丢失,而且捕获了具有长距离依赖的全局信息,有效提升了特征提取的能力。其次,论文中采用一种数据相关的上采样方法代替双线性插值法恢复特征
其他文献
本文对基于跳频的宽带RFID测距系统进行研究,分析了该测距系统结构及多频点联合距离解算原理、载波相位的求解过程;研究了相位误差度量函数,解释了在多频点距离解算中出现整周求解错误的原因;提出多径等典型误差的消除方法,提升了系统性能。实际测试结果表明,跳频的多频点载波相位和距离之间呈现规则的变化趋势;本文的误差抑制方法能有效减少整周求解错误,在使用误差抑制后系统测距平均误差从10cm减小到了2.5cm
针对当前分割方法不能兼顾可见光与近红外光谱的异质噪声虹膜图像的分割精度与效率问题,提出一种基于注意力机制与密集多尺度特征融合的编-解码网络。首先,引入基于深度可分离卷积的改进残差瓶颈单元,降低参数量与计算量的同时减少信息丢失与梯度混淆;其次,改进密集空洞空间金字塔模块的空洞率组合并放置于编码器后以增强多尺度特征融合;最后,设计了一种高效并行空间-通道注意力模块并添加至每个下采样层与解码器之后,提升
为了解决伪装效能评估手段单一、量化分析手段不足的问题,引入了余弦相似度原理开展模拟评估,对可见光伪装效能评估理论分析进行了优化。基于颜色光学数据特征,利用颜色直方图展现了目标与背景颜色频率分布,研究了样本目标与背景的颜色融合差异性;通过亮度空间分布图,展现了亮度空间特征,探索了样本目标与背景的亮度差异性;通过对目标和背景图像的像素数据采集和计算,量化研究了目标和背景的融合效果;以典型验证实例为依托
抓取目标多样性、位姿随机性严重制约了机器人抓取的任务适应性,为提高机器人抓取成功率,提出一种融合多尺度特征的机器人抓取位姿估计方法。该方法以RGD信息为输入,采用ResNet-50主干网络,融合FPN获得多尺度特征作为抓取生成网络的输入,以生成抓取候选框;并将抓取方向坐标映射为抓取方向的分类任务,使用ROI Align进行感兴趣区域提取,评估抓取候选框,获取目标的最优抓取位姿。为验证本文算法有效性
本文通过将深度学习技术应用到细胞识别中,实现了一种可以通过普通光学显微镜拍照,并直接在培养皿中进行细胞识别计数的方法。本文通过构建U-net网络结构,并对贴壁细胞和悬浮细胞图像进行标记训练,来实现贴壁细胞和悬浮细胞的分割计数。同时,本文用该算法绘制了细胞生长曲线以及计算了抑制剂的抑制率,通过这些应用来说明了该算法的实用性。
视觉传感器正成为移动装置的重要组成部分或任务载荷。视频信号存在的抖动,限制了视觉传感器的应用范围。现有电子稳像技术由于只使用单一的图像特征为依据,所以无法实现复杂场景视频的稳像。本文以多视几何为理论依据,提出了一种基于相机阵列的视频稳像方法。其特点在于将相机阵列用于获取复杂场景的视频信息,将线匹配用于估计相机阵列的运动轨迹,进而实现视频稳像。实验结果表明相对于对比算法,本文算法可以获得更好的视觉效
行人重识别是指从一堆候选图片中找到与目标最相似的行人图片,本质上是一个图像检索的子问题。为了进一步增强网络提取关键特征的能力以及抑制噪声的干扰,通过对基于注意力机制和局部特征的行人重识别算法的研究,提出了结合注意力与局部特征融合的行人重识别算法。该算法将ResNeSt-50作为骨干网络,联合软注意力与非局部注意力机制,采用双流结构分别提取行人细粒度全局特征和细粒度局部特征,通过关注不同特征之间共享
正交匹配追踪(Orthogonal Matching Pursuit,OMP)算法是压缩感知系统中应用最广泛的重构算法之一。OMP算法中的最小二乘(Least Squares,LS)问题涉及到矩阵求逆运算,是计算复杂度最高的部分。本文提出了一种近似OMP算法,通过优化最小二乘问题提高重构速度,更利于硬件实现。设计了一种基于FPGA的近似OMP算法的硬件实现架构,主要包含计算模块、存储模块和控制模块
大多数图像标签完备方法仅依据待完备图像的视觉特征搜索近邻图像,获取候选标签实现完备,往往忽略候选标签与初始标签隐含的语义和视觉关系。为有效完备图像标签,本文依据信息的相互学习机制提出一种基于视觉和语义互学习的标签完备标注方法。首先,依据待完备图像的视觉特征和初始标签语义,搜索其近邻图像集并获取候选标签;其次,根据候选标签与初始标签的视觉内容相似性和语义相关性度量候选标签与待完备图像的关联度;最后,
本研究以濒危物种观光木(Tsoongiodendron odorum)为研究对象,通过测定广西地区5个不同纬度上观光木当年生小枝及叶片功能性状,探讨观光木当年生枝条生物量的分配规律和叶片功能性状的变化规律及其影响因素。结果表明:(1)随着纬度的增加小枝总重和总叶重总体呈异速生长关系,其生物量更多的趋于对小枝的构建。(2)观光木叶功能性状呈现一定规律:从南向北随纬度的增加,其叶面积、叶重呈逐渐降低的