基于深度学习的图像抠图技术

来源 :上海大学学报(自然科学版) | 被引量 : 0次 | 上传用户:jtls
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像抠图技术(Image Matting)是图像编辑技术的基础,广泛应用于影视后期制作和日常生活。基于深度学习的图像抠图网络,通过输入的原图和三元图来估计每个像素的α值。本文在原下采样上采样的图像抠图技术基础上,针对抠图数据集图片差异较大容易造成网络收敛较慢的问题,在每个卷积层后加入了BN(Batch Normalization)层,对输入数据进行归一化操作,加快模型收敛速度,同时参数更新方向更符合数据集整体特性;针对于抠图任务需要更关注于物体边缘部分的特点,使用可变形卷积(Deformable C
其他文献
针对眼底视网膜血管分割中血管边界难以精确识别以及血管与背景对比度低而难以分割的问题,提出一种编码器-解码器结构的算法。为了提高算法在血管边界的分割能力,在编码部分采用全局卷积网络和边界细化替换传统的卷积层;在跳跃连接部分引入改进的位置注意模块和通道注意模块,目的是增加血管与背景之间的对比度,使网络更好的将血管与背景分割开;此外,为了提高网络的性能,在编码部分的最后一层使用密集卷积网络解决网络过拟合
期刊
目前视频目标分割算法多是基于匹配和传播策略分割目标,常常以掩模或者光流的方式利用前一帧的信息, 该文探索了新的帧间特征传播方式,利用短时匹配模块提取前一帧信息并传播给当前帧,提出一种面向视频序列数据的目标分割模型. 通过长时匹配模块和短时匹配模块分别与第一帧和前一帧做相关操作进行像素级匹配,得到的全局相似性图和局部相似性图,以及前一帧的掩模和当前帧的特征图,经过两个优化网络后通过分割网络得到分割结
期刊
RGB-D图像显著性检测旨在提取三维图像中的显著目标。为解决当前显著性检测算法难以检测出光线干扰场景内的目标和低对比度的目标等问题,提出了基于跳层卷积神经网络的RGB-D图像显著性检测方法。利用VGG网络分离出RGB图像和深度图像的浅层与深层特征,而后进行特征提取;以跳层结构为基础连接提取到的特征,实现融合深度、颜色、高级语义和细节信息的目标,同时生成侧输出;最后,将侧输出进行融合,得到最佳的显著
期刊
Dear editor,The human motion recognition based on the segmented datasets is a hot multidisciplinary research topic in the field of computer vision. However, in reality, the collected data is without s
期刊
利用深度学习技术对颅脑核磁共振图像(MRI)中三叉神经区域进行自动检测可为后续三叉神经分割提供可靠的输入图像,从而有效解决人工筛选三叉神经对临床医生专业素养要求高、耗时长等弊端。采用YOLO网络用于自动检测颅脑核磁共振图像的三叉神经区域,为提高推理速度,系统性地评估了NVIDIA TensorRT框架在不同计算平台下的推理性能。实验结果表明通过YOLO目标检测网络能够准确检测出包含三叉神经的区域,
期刊
应用基于各种卷积神经网络算法的图像处理技术对表面缺陷进行检测识别,不仅可以降低人工的成本,还可以大大提高效率和准确度。但是,当前比较热门的图像处理技术普遍存在计算量大、存储成本高以及模型复杂等特点,与工业应用所要求的高实时性以及有限的计算资源相悖。因此提出一种基于多尺度压缩卷积神经网络模型(MC-CNN)进行表面缺陷快速检测,通过网络结构优化、知识蒸馏、网络修剪以及参数量化等压缩方法对网络进行多尺
期刊
图像配准任务要求算法能够将不同视角、不同时间或不同传感器采集到的图像进行匹配,使其达到像素间的对准关系。图像配准是数字图像处理领域的一项关键技术,被广泛应用在医学影像诊断、遥感监测、立体视觉等领域。现有的图像配准算法中,借助图像采集设备参数的方法存在硬件内参难以获得或精度不够的问题,采用匹配图像特征计算图像单应性的方法存在对场景的深度信息利用不全的问题。针对这一现象,提出结合可见光图像与其深度信息
期刊
近年来,以换脸为代表的伪造视频泛滥,有效检测此类视频对保护个人隐私和维护国家安全具有重要意义。为了提高视频伪造人脸检测效果,本文基于可解释性好的胶囊网络,以Capsule-Forensics检测算法为基础,提出了一种结合自注意力胶囊网络的伪造人脸检测方法。该方法使用部分Xception网络作为特征提取部分,降低了模型的参数量。主体部分引入带注意力机制的胶囊结构,使模型聚焦人脸区域。最后使用综合多维
期刊
图像的恰可察觉失真(just noticeable distortion, JND)阈值是指人眼能够察觉的最小失真,用于去除图像/视频压缩中的视觉冗余。针对JND模型对颜色和结构特征利用不充分的问题,提出一种基于颜色复杂度和结构张量的JND模型。首先,计算图像的颜色复杂度,转换为与视觉敏感度相关的权值,和对比掩蔽模型结合以提升模型的准确性;然后,利用结构张量对局部特征进行表示,建立基于局部结构特征
期刊
针对缺陷检测中的表面细微缺陷难以检测问题,提出了一种基于超分辨率特征融合的数据扩增模型。设计了包含数据层(Data)、超分辨率特征提取与样本修复层(Super-resolution feature extraction and sample Repair,SR-Re)与数据扩增层(Merge-Augmentation,M-A)的三层结构模型。Data层完成样本划分,并以缺陷特征像元占比小于0.33
期刊