【摘 要】
:
随着目标跟踪在众多生活场景的广泛运用,高精度且高速的跟踪算法需求也日益增多。针对某些特定场景如移动端、嵌入式等设备,在设备算力相对不足的前提下,仍要保证跟踪器达到良好的跟踪精度和高速实时跟踪问题,提出一种高帧率的轻量级孪生网络目标跟踪算法。首先,选取易于部署在嵌入式设备中的轻量级卷积神经网络MobileNetV1作为特征提取网络,深层网络具有对目标特征强大的提取能力;接着,针对主干网络的不足提出两
论文部分内容阅读
随着目标跟踪在众多生活场景的广泛运用,高精度且高速的跟踪算法需求也日益增多。针对某些特定场景如移动端、嵌入式等设备,在设备算力相对不足的前提下,仍要保证跟踪器达到良好的跟踪精度和高速实时跟踪问题,提出一种高帧率的轻量级孪生网络目标跟踪算法。首先,选取易于部署在嵌入式设备中的轻量级卷积神经网络MobileNetV1作为特征提取网络,深层网络具有对目标特征强大的提取能力;接着,针对主干网络的不足提出两点优化策略,特征图裁剪和网络总步长调整,使得主干网络适用于跟踪任务;最后,在孪生网络的模板分支后添加超轻
其他文献
近年来,以换脸为代表的伪造视频泛滥,有效检测此类视频对保护个人隐私和维护国家安全具有重要意义。为了提高视频伪造人脸检测效果,本文基于可解释性好的胶囊网络,以Capsule-Forensics检测算法为基础,提出了一种结合自注意力胶囊网络的伪造人脸检测方法。该方法使用部分Xception网络作为特征提取部分,降低了模型的参数量。主体部分引入带注意力机制的胶囊结构,使模型聚焦人脸区域。最后使用综合多维
图像的恰可察觉失真(just noticeable distortion, JND)阈值是指人眼能够察觉的最小失真,用于去除图像/视频压缩中的视觉冗余。针对JND模型对颜色和结构特征利用不充分的问题,提出一种基于颜色复杂度和结构张量的JND模型。首先,计算图像的颜色复杂度,转换为与视觉敏感度相关的权值,和对比掩蔽模型结合以提升模型的准确性;然后,利用结构张量对局部特征进行表示,建立基于局部结构特征
针对缺陷检测中的表面细微缺陷难以检测问题,提出了一种基于超分辨率特征融合的数据扩增模型。设计了包含数据层(Data)、超分辨率特征提取与样本修复层(Super-resolution feature extraction and sample Repair,SR-Re)与数据扩增层(Merge-Augmentation,M-A)的三层结构模型。Data层完成样本划分,并以缺陷特征像元占比小于0.33
图像抠图技术(Image Matting)是图像编辑技术的基础,广泛应用于影视后期制作和日常生活。基于深度学习的图像抠图网络,通过输入的原图和三元图来估计每个像素的α值。本文在原下采样上采样的图像抠图技术基础上,针对抠图数据集图片差异较大容易造成网络收敛较慢的问题,在每个卷积层后加入了BN(Batch Normalization)层,对输入数据进行归一化操作,加快模型收敛速度,同时参数更新方向更符
求解三点问题的传统方法是作图法。目前缺乏利用初等几何学求解三点问题的完整计算方法。基于三点法的原理,利用初等几何学知识推导了求断层面倾角、倾向和走向的计算公式。断层面倾角计算公式是以已知三点之间水平距离和三点之间高差为变量的代数表达式。断层面倾向或走向计算公式是以已知三点之间水平距离、三点之间高差和三点连线的方位角为变量的代数表达式。利用这些新公式易于编制计算程序。提出应用三点法求隐伏活动断层面产
针对水体浑浊情况下,水中悬浮粒子对光的吸收和散射作用造成图像模糊、对比度低等问题,提出一种基于单通道偏振系统的水下降质图像复原方法。首先,将偏振信息融入水下成像复原模型;其次,通过局部最小值滤波估算水下背景光图像,引入Stokes矢量原理计算偏振度,通过归一化互信息进一步优化偏振度信息;再次,采用形态学的方法重建图像自动估计水下无穷远处背景光值;最后搭建水下环境模拟平台,通过单通道偏振探测器实时获
随着深度学习的发展,唇语识别技术在英文方面取得了长足的进步,但中文无论是在数据集丰富性还是识别准确率上均存在一定的落差。通过分析中文发音的视觉特点,提出“视觉拼音”,意图规避中文在视觉表达上的歧义性;为了验证视觉拼音的有效性,建立了中文句子级唇语识别模型CHSLR-VP,该模型是一个端到端结构,其中以视觉拼音为媒介,将视频帧序列转换成最终的汉字语句。通过实验得出,相比于其他唇语识别方法,基于视觉拼
针对SSD算法在目标检测过程中对小目标检测的不足,提出了一种基于SSD算法的一阶段目标检测器--FIENet(featureintegrationandfeatureenhancementnetwork)。在FIENet中设计了两个模块,一是特征融合模块,该模块对SSD浅层的特征映射信息进行融合以提高小目标检测能力;二是特征增强模块,该模块采用了残差网络(Res2Net)以及注意力机制(Atten
针对细粒度图像分类任务中种类间局部信息差异性较小,通常会导致模型表征能力不足、特征通道之间的相互依赖关系较差以及无法有效捕捉到显著且多样化的特征信息等问题。本文提出了一种双线性聚合残差注意力网络(BilinearAggregateResidualAttentionNetwork,BARAN),首先在原双线性模型(B-CNN)基础上,把原有特征提取子网络转变为更具学习能力的聚合残差网络,来提升网络的
目前主流的深度学习方法用于微表情识别存在实验数据非常稀缺的问题,导致神经网络在学习的过程中知识获取有限进而难以提升精度。针对目前存在的问题,提出双流网络时间域信息交互的微表情识别方法,构建了双流时间域信息交互卷积神经网络(Dual Scale Temporal Interactive Convolution Neural Network,DSTICNN),网络对微表情序列进行处理,进而实现微表情自