基于深度学习的自动抠图方法研究

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:yaoyao0313
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
抠图是计算机视觉的重点研究问题之一,是一种从图像或视频中精确提取前景对象的不透明信息的技术。在影视特效、广告设计、图像编辑、电子商务等领域被广泛应用。对于图像中的前景提取,图像分割算法为图像中每个像素预测一个离散的语义标签,是一种硬分割。硬分割对于包含网状物体、半透明的物体、镂空物体、毛发细节信息丰富等的图像,得到的结果往往视觉效果欠佳。而抠图作为一种软分割,可以很好的解决图像分割遇到的难题。相比于图像分割这种求解像素的分类问题,抠图所要求解的是逐像素的离散值,本质上是一个回归问题,也是一个极具有挑战的任务。本文针对两种不同的抠图场景,展开了相关技术研究,设计了两种高精度的图像抠图方法,并同时针对人像抠图问题开发了一个全自动抠图系统软件。本文对图像抠图技术展开了以下研究:(1)为了克服人像抠图中存在需要人工交互,时效性低,抠图精度不高等问题,提出了一个基于深度学习的全自动人像图像抠图方法。本方法引入语义分割和残差网络的思想,首先使用语义分割的方法为RGB图像预测三元图,为后面的网络预测每个像素的透明度提供语义指导并不断进行修正:其次使用Resnet50作为编码器的主干网络,来提取深层次的语义特征。并引入Trimap损失,构建多任务损失函数指导网络训练:最后设计了一个高效的融合模块,对预测的透明度遮罩信息进行优化,去掉冗余信息和丰富细节信息,从而达到提高抠图精度的目的。在1000张人像数据组成的测试集上,本方法的结果与U2Net matting方法相比在SAD、MSE、Grad和Conn指标上分别提高19.4、23.1、14.6和7.2个百分点:本方法的结果与MODNet matting方法相比在SAD和MSE指标上分别提高4.6和9.1个百分点。(2)针对自然图像抠图的背景纹理和颜色复杂多样,前景种类繁多,并且前景背景细节信息较多,存在半透明的前景等问题,提出了基于Trimap的自然图像抠图方法。该方法首先充分利用Trimap作为先验信息的指导作用,将RGB图像和Trimap进行通道拼接,作为网络的输入信息,在编码网络阶段提取出图像不同深度的语义信息;其次引入空洞空间卷积金字塔模块,实现在不改变图像分辨率和参数规模的条件下,通过扩大感受野来更好地捕获图像的上下文信息目的;然后使用一种索引模块来改善采样过程,减少由于采样所造成部分细节信息丢失的问题;最后使用跳跃连接在解码网络中结合编码网络所对应的高低级别的语义信息,重构出高精度的Alpha matte。本方法通过实验验证,在公开数据集Composition-1k上同现有方法进行比较,取得了不错的效果。(3)为了提高研究的实际价值,针对人像抠图任务,开发了一款全自动抠图软件。用户只需要输入RGB的人像图片,就可以输出人像图像中的前景信息。
其他文献
为实现致密气/页岩气的大力开发,解决高压气井带压完井的难题,利用连续管带压作业的优势,形成连续管完井采气一体化技术,文章研制了一种多功能节流器。该节流器采用回压阀、节流嘴以及堵头等多种功能组件的组合设计,通过全流程工序,可以实现带压下连续管、高产期节流降压生产、低产期速度管柱生产、间歇期柱塞气举以及枯竭期井底封堵起出管柱等功能。室内试验及现场应用结果表明,多功能节流器各组件工作良好,可以满足高压气
期刊
枣树是新疆主要的经济林果之一,该地区降水稀少,蒸发强烈,以塔里木河水作为主要灌溉水源,有限的水资源极大约束了枣树种植业的发展。采用精准高效的节水灌溉技术是实现枣树节水增效的有效途径。本文以灰枣为研究对象,于2017 2020年开展竖管灌溉田间试验,并以地表滴灌为对照。研究竖管连续灌溉条件下枣树的生长特性、耗水规律、灌水效率和其对枣树产量、品质的影响。主要研究成果如下:(1)竖管连续灌溉枣树田间试验
学位
好氧堆肥技术能有效处理畜禽养殖和农产品种植过程中产生的农业废弃物,但是传统的好氧堆肥普遍存在着堆肥周期较长、腐熟程度较低、氮素损失较大、容易造成环境二次污染等缺点。因此,本研究通过将不同强度磁化水(1000Gs(C1)、3000Gs(C3)、5000Gs(C5))应用于牛粪-秸秆好氧堆肥试验中,分析其对好氧堆肥快速腐熟的影响机理,选出最优强度的磁化水,并进一步将生物炭、硫酸亚铁、巨大芽孢杆用于堆肥
学位
畜禽粪便农用直接引入外源抗生素抗性基因(ARGs)和抗生素抗性细菌(ARBs),饲料添加剂的抗生素和Cu也可以促进ARGs在土壤中的增殖和传播,降低抗生素对致病菌的功效,从而危及人类健康。生物炭是很好农田土壤的改良剂和污染修复剂,纳米粒径生物炭(NBC)具有更大的比表面积以及更发达的微孔结构,表面含有更多的含氧官能团以及矿质元素对Cu具有很好的吸附性能,生物炭含有丰富的微孔,可以储存水分和营养物质
学位
网络大数据具有复杂多样且高速流动的特点,导致对异常节点智能检测性能过差,增加网络故障风险。为了及时修复网络大数据异常节点,提出盲均衡算法下网络大数据异常节点智能检测的方法。通过传感序列采集模型采集网络大数据节点,在DHA去噪算法下,按节点疏密性优化采集结果,利用盲均衡算法提取噪声均值,显著降低网络大数据异常节点特征。将特征作为训练样本输入K-means聚类算法中,输出的最佳聚类结果,实现网络大数据
期刊
<正> 随着现代化工业的迅速发展,环境污染日趋严重,它给人类健康带来了直接影响和威胁。据联合国调查统计,全世界每天至少有1200人的死亡是与水质相关。因此,保护环境已是一个十分现实的课题,并成为仅次于能源紧张和水源不足的第三个重大社会问
期刊
随着社会经济的发展,人们对水资源的需求量日益增加,水资源短缺逐渐成为限制社会发展的重要因素,同时水污染严重与水生态环境恶化等问题加剧了水资源的短缺,导致水资源供需不平衡这一矛盾日益突出。为缓解水资源供需紧张问题,提高水资源利用效率,国家提出了实行最严水资源管理制度,并划定了水资源“三条红线”。“三条红线”的提出,对原有区域水资源优化配置从限定条件和执行模式都提出了新的要求。为此,如何在“三条红线”
学位
面对日益激烈的市场竞争环境,越来越多企业出于自身有限资源及外部优势互补思考,将大量产品组件和(子)系统等模块创新开发工作委托给更具专业优势互补能力的供应商独立自主负责,以期快速协同开发出更具竞争性的创新产品。这一产品协同开发战略模式即所谓的“黑箱供应商参与新产品开发”。但实际中这一参与实践并非总能取得预期的创新成效,究其原因是企业无法与黑箱供应商实现双方知识优势的良好整合,因而这一整合问题的解决成
学位
光热发电是清洁能源利用的一种重要途径近年来,人们提出将超临界CO2布雷顿循环应用于光热发电领域,以提高能源利用效率降低太阳能热电站成本。在上述动力循环中,超临界二氧化碳作为工作介质其流动传热特性直接影响能量传输效率和安全稳定性。然而,超临界CO2拟临界点附近物性变化剧烈,由于变物性、浮升力等的影响,致使超临界CO2流动传热特性复杂多变,流动传热规律明显不同于单相流体。因此,本文以超临界CO2为研究
学位
随着科技发展与经济全球化的脚步加快,大数据技术在日趋走向成熟,在不同行业内的应用越来越丰富,面对不断变化的经营环境,提升绩效对企业来说越来越困难,然而企业追求高绩效的脚步从未停止,在竞争的促使下,企业中新的产品、技术以及商业模式不断出现。制造业企业在环境的影响下进入了高质量发展阶段,单一的产品创新已经不足以维持企业的可持续发展,商业模式创新成为了制造业企业间的重要竞争手段,同时,面对环境的动态性,
学位