【摘 要】
:
语义分割作完成像素级的分类任务,上下文信息对分割的性能有重要的影响.为了获取更丰富的上下文信息,采用ResNet作为主干网络,设计了一个基于多维度注意模块(Multidimensional attention,MDA)和多尺度上采样模块(Multiscale upsampling,MSU)的编码器-解码器结构.多维度注意力模块计算三个维度的注意力矩阵,以获取每个位置的依赖性,同时注意力机制能自适应地捕捉图像特征.多尺度上采样模块采用并行分支来捕获图像的多尺度特征,多尺度特征聚合有效地增强了图像的上下文信息
【机 构】
:
齐齐哈尔大学机电工程学院,黑龙江齐齐哈尔161000;黑龙江省智能制造装备产业化协同创新中心,黑龙江齐齐哈尔161000
论文部分内容阅读
语义分割作完成像素级的分类任务,上下文信息对分割的性能有重要的影响.为了获取更丰富的上下文信息,采用ResNet作为主干网络,设计了一个基于多维度注意模块(Multidimensional attention,MDA)和多尺度上采样模块(Multiscale upsampling,MSU)的编码器-解码器结构.多维度注意力模块计算三个维度的注意力矩阵,以获取每个位置的依赖性,同时注意力机制能自适应地捕捉图像特征.多尺度上采样模块采用并行分支来捕获图像的多尺度特征,多尺度特征聚合有效地增强了图像的上下文信息.在Cityscapes和Camvid数据集上进行的一系列实验表明,该网络能有效提升图像分割精度.“,”Semantic segmentation is for pixel-level classification tasks,and contextual information has an important impact on the performance of segmentation.In order to capture richer contextual information,we adopt ResNet as the backbone network and designs an encoder-decoder architecture based on multidimensional attention(MDA)module and multiscale upsampling(MSU)module.The MDA module calculates the attention matrices of the three dimensions to capture the dependency of each position,and adaptively captures the image features.The MSU module adopts parallel branches to capture the multiscale features of the images,and multiscale feature aggregation can enhance contextual information.A series of experiments demonstrate the validity of the model on Cityscapes and Camvid datasets.
其他文献
轴向柱塞泵压力脉动既是引起液压系统转速波动、振动噪声以及输出稳定性的重要原因,也是获取故障信息的主要信息源.液压系统具有强噪声干扰特性,导致监测信号信噪比低,因此很有必要深度挖掘压力信号携带的系统运行状态信息.本文首先通过柱塞泵流量损失机理,来分析流量脉动与压力脉动之间的映射关系.之后基于标准Gabor变换对压力信号进行滤波重构.最后根据压力信号时域波形形貌,提出4个特征指标来分析不同运行工况下的压力脉动特点.实验结果表明:标准Gabor变换能够准确提取信号中的高次谐波及相位频率.其重构的轴向柱塞泵压力脉
利用SFH4737宽波段红外LED、多波长光谱传感器以及自主开发的数据处理软件,设计了一种基于多波长光谱传感器的浊度测量系统.结合传感器多个波长数据,分别构建了单元和多元拟合模型,探究光强信息、吸光度与浊度的关系,用于实际水体浊度的测量,并将结果与商用可见分光光度计的测定结果进行对比分析.对立样本T检验(p>0.05)表明,本文方法与标准检测方法无显著差异,且操作简单,成本低廉,可应用于水质浊度的快速检测,为工业在线测量提供了一种新的策略.“,”A method of measuring turbidit
使用全球定系统/北斗卫星导航(Global positioning system/BeiDou navigation satellite system,GPS/BDS)双模导航系统定位列车时,根据双模观测量的特点,若卡尔曼滤波方法对列车位置解算,需对算法进行相应的调整;并且受多径效应影响,传统卡尔曼滤波算法的定位精度较低.针对这些问题,提出了混浊免疫粒子群优化算法以提高卡尔曼滤波输出精度.首先,利用混沌映射及免疫接种方法,对粒子群算法进行优化,再用优化后的粒子群算法对观测误差协方差矩阵寻优.然后,将最优参
建立成像过程的能力对于视觉测量至关重要.非参数相机模型将图像形成过程描述为与来自物体的空间射线对应的像素集合.然而,非参数模型需要复杂的计算或高成本的装置来获取大量参数,这限制了该模型的应用.为此,提出了一种基于单轴旋转靶标的非参数成像模型标定方法.旋转靶标提供三维控制点,并引入径向基神经网络将三维坐标映射到二维图像坐标.该方法无需旋转靶标的详细位姿信息,从而避免了额外的角度测量设备.随后,推导出成像模型参数的目标函数,给出了优化步骤,进而计算出模型参数.在获得单个相机中的光线轨迹后,该模型被迁移于双目立
自注意力网络和Transformer主导了机器翻译和自然语言处理领域,并在诸如图像分类和目标检测等图像视觉任务中显示出巨大潜力.受到Transformer在2D图像视觉任务中取得的巨大进步的启发,提出了一种基于传统Transformer的新颖和鲁棒的体素特征编码器.首先,探究自注意力对序列数据的排列不变性,并将其应用于点云数据处理.其次,基于自注意力构造体素特征层,根据体素内所有点之间的空间关系和上下文信息交换自适应地学习体素的局部和鲁棒上下文.最后,构建了以体素特征层为核心的通用3D目标检测框架.VFT
舰载机自动着舰系统性能评估是舰载机着舰控制技术领域的一个重要部分.结合灰色层次评估理论与数据归一化的特点,提出了一种新的灰色层次评估方法,用于对自动着舰系统性能进行评估.建立了完整的自动着舰系统性能评价指标体系,并给出各指标的定义和计算公式.为提高算法的实时性,给出了改进的灰色层次分析模型,改进后的模型以指标归一化样本矩阵代替传统的专家打分样本矩阵.以某自动着舰系统为例进行评估仿真,实验结果证明改进后的灰色层次评估方法具有优异的可靠性和准确性.“,”The performance evaluation o
雷达罩、扰流板等装备中广泛采用了纤维增强玻璃结构.在工程实践中,此类结构由于受到表面结构磨损、老化、冲击、化学腐蚀等因素的影响,其内部结构逐渐演变成缺陷状态,扩展形成诸如气泡、划痕、缺胶、裂纹、空蚀、污点等缺陷,这些缺陷对设备质量性能已构成严重威胁.从纤维增强玻璃结构缺陷的传播过程来看,其持续时间随机,且可能很短.因此,设计一套科学的纤维增强玻璃结构微缺陷智能检测系统,增强纤维增强玻璃结构的维护性,不仅有助于减少突发事件,而且对确保安全生产运行具有积极的理论意义和应用价值.首先,讨论了纤维增强玻璃结构的缺
基于对多脉波整流系统直流侧谐波抑制的研究,在Matlab环境下建立了软件平台,从系统稳定性和经济性的角度出发研究了移相角,并分析了移相角对12脉波整流系统中输入侧线电流、输出侧电压纹波、自耦变压器等效容量和系统中其他辅助器件的影响.该软件平台只需输入初始条件便可完成分析,无需公式推导,降低了系统分析复杂度,具有良好的扩展性.仿真结果表明,该系统能有效分析移相角对12脉波星形连接变压器的影响.“,”Based on the study of the harmonic suppression on DC si
新型磁集成结构变压器式可控电抗器(Controllable reactor of transformer type,CRT)具有结构简单、装配灵活、维护方便的优点.为了对新型磁集成CRT运行特性进行准确分析,基于磁路-电路对偶变换法,建立了计及漏磁的新型磁集成CRT等效数学模型,对各绕组漏磁场分布情况进行了定性分析,并推导出新型磁集成CRT各绕组激磁电感与漏电感解析计算公式.在此基础上,进一步推导出不同工况下CRT短路阻抗与各绕组电流的解析计算公式并设计算例,建立了新型磁集成CRT的场路耦合有限元仿真模型