【摘 要】
:
针对自然场景中任意形状文本容易漏检、错检的问题,提出了一种基于双重注意力融合和空洞残差特征增强的场景文本检测方法。为了增强文本特征通道之间的潜在联系,提出了双重注意力融合(DAF)模块,采用双向特征金字塔与双重注意力融合模块相结合的方式进行多层的特征融合;另外针对深层特征图在降维的过程中可能造成语义丢失的现象,提出了空洞残差特征增强(D-RFA)模块。通过在弯曲文本数据集CTW1500上的测试表明
论文部分内容阅读
针对自然场景中任意形状文本容易漏检、错检的问题,提出了一种基于双重注意力融合和空洞残差特征增强的场景文本检测方法。为了增强文本特征通道之间的潜在联系,提出了双重注意力融合(DAF)模块,采用双向特征金字塔与双重注意力融合模块相结合的方式进行多层的特征融合;另外针对深层特征图在降维的过程中可能造成语义丢失的现象,提出了空洞残差特征增强(D-RFA)模块。通过在弯曲文本数据集CTW1500上的测试表明,该方法的准确率、召回率和F值分别达到了87.8%、84.2%和86.0%,同时在多方向文本数据集ICD
其他文献
针对利用深度学习方法计算三维模型间稠密对应关系时算法泛化能力较差的问题,提出了一种基于无监督变形网络计算对应关系的新方法。首先通过基于螺旋卷积的模板特征提取网络计算非参数化模板的局部特征描述符;其次在模板变形网络中利用编码器获取输入模型的全局特征,并与模板的局部特征描述符拼接,将拼接后的特征输入到解码器中计算模板的变形模型;最后通过最近邻搜索算法计算变形模型与输入模型之间的稠密对应关系。实验结果表
Leap Motion因其追踪精度高、手势交互性好的优点被广泛运用于各类虚拟安装。将Leap Motion手势识别应用于高集成度大型结构件的高精度虚拟安装,可实现虚拟手对安装过程的交互控制。设计了一种基于加权卡方距离的模糊KNN分类方法实现虚拟手势分类,根据手势特征的重要性赋予不同权值,可进一步提高分类准确率,测试结果表明改进分类方法识别准确率达到92.7%,比传统分类算法提高5.3%。使用三种手
针对织物疵点纹理多变、类型多样和尺度不一的特点,提出了优化Faster R-CNN疵点检测模型。将基于卷积模块的注意力机制(convolutional block attention module,CBAM)引入经典Faster R-CNN模型中,对建立的6 317张包含污渍、破洞、跳花、断经、断纬、缺经、缺纬和并纬等疵点的织物图片样本库进行CBAM的改进模型与原模型对比实验。结果表明:优化后的网
随着中国高速铁路里程的迅速增长,接触网安全稳定运营面临巨大压力,对其进行视频监控具有重要意义。针对影响电气化铁路接触网正常工作的鸟巢异物进行研究,提出一种基于深度学习的鸟巢异物检测方法,首先利用最邻近插值法进行图像缩放,然后采用双边滤波算法对图像进行去噪,进而用直方图均衡化算法进行图像增强。通过将YOLO v3与Faster RCNN两种目标检测方法进行详细对比分析,给出了准确率、误检率、漏检率和
在铁矿石烧结过程中,烧结机尾断面图像中的火焰区域蕴含着大量烧结特征信息。为有效识别烧结断面火焰核心区域,本文提出了改进的粒子滤波算法对烧结断面图像进行火焰区域跟踪。在经典粒子滤波算法中引入RGB颜色空间生成带权粒子。同时,烧结过程中火焰区域可能合并、分裂及脱落,对粒子滤波算法中重采样方法进行权值优化、粒子舍弃与重采样策略优化,避免由粒子退化现象与样本贫乏问题引起跟踪失败。结果表明,改进的粒子滤波算
人脸姿态估计在人脸识别、人机交互和面部表情分析等领域应用广泛,其中一个重要的指标是人脸姿态估计的精度。针对获取的三维(3D)人脸模型存在偏转角度的问题,提出一种基于对称平面的3D人脸姿态估计算法。依据人脸具有的左右对称性来提取对称平面,进而计算对称轮廓;将对称平面与yoz坐标平面对齐,获得首次姿态调整结果;将对称轮廓两端点构成的向量调整到与y坐标轴平行,获得第二次姿态调整结果。综合两次调整,得出姿
为提高相移条纹投影测量系统的精度与效率,提出了一种四步相移结合互补格雷码的快速相位展开方法,有效消除了相位展开误差,并能够显著提升计算效率。引入的互补格雷码与传统格雷码的条纹阶次存在半周期错位,利用这种错位与中值滤波结合可完全消除相位展开误差。首先,采用大津法对全亮图案进行二值化生成掩码图像;其次,以掩码图像非零区域为路径引导四步相移与互补格雷码解码得到包裹相位与条纹阶次;最后,利用条纹阶次对包裹
为完善黑钙土地区秸秆还田技术,提升黑钙土可持续生产能力提供理论和实践依据,以吉林省典型黑钙土为供试土壤,采用室内培养法研究秸秆与两种氮肥(尿素和磷酸二铵)配施对黑钙土有机碳(SOC)和微生物量碳氮的影响。结果表明,黑钙土SOC含量随秸秆添加量的增加而增加,增幅达6.27%~31.84%。尿素和磷酸二铵配施显著提高了黑钙土SOC含量,且磷酸二铵的提升效果更好。秸秆还田增加了黑钙土微生物量碳(SMBC
针对现有基于深度学习的自然图像超分辨率算法在图像高频细节重建方面的不足,提出了一种更注重图像高频细节重建的基于双通道残差网络的图像超分辨率算法。该算法使用带有通道注意力机制的残差结构作为网络的主通道,为了在重建过程中更好地保留原始图像的几何结构和边缘信息,使用自适应结构化卷积设计了网络的辅助通道,以此构建的双通道残差网络在学习过程中会有更强的高频信息捕获能力。为了使重建图像效果更加符合人眼的主观视
脑肿瘤是世界上最致命的癌症之一。由于脑肿瘤的样性,其图像分类成为了当代研究的热点。近年来,深度神经网络(DNN)常用于医学图像分类,但随着深度的增加网络会出现梯度消失和过拟合的问题,而残差网络(ResNet)通过引入恒等映射可以缓解这些问题。因此,本文基于ResNet提出了一种MDM-ResNet网络,该网络由多尺寸卷积核模块(Multi-size convolution kernel modul