基于深度学习的可交互图像着色

来源 :湖南大学 | 被引量 : 0次 | 上传用户:czd1986624
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近来,深度学习在图像处理领域表现出了强大的解决问题的能力,比如灰度图着色,图像增强,图像分类,图像检测,图像补全和风格转换等。由于彩色图的信息丰富度更高和价值更大,灰度图着色一直是图像领域的研究热点。目前的着色方法主要分为用户指导着色,基于示例的半自动着色和全自动着色,但传统算法着色存在效率低下、着色效果不理想等问题,且当前已有的着色交互方式存在操作方式困难、用户难以控制着色结果、难以找到合适参考图等问题,难以投入到现实应用中为用户群体带来实际意义。因此,随着人类对用户体验要求的不断提高,以及深度学习在图像处理上展现的影响力和作用,研究基于深度学习的图像着色算法具有非常实际的意义。针对当前深度学习的发展状况、已有理论及研究成果,以及综合已有着色方法的优缺点和局限性,本文提出了一种新颖的基于深度学习的可交互图像着色方法,主要工作内容有:(1)提出了结合全局输入与局部输入的着色交互方式,搭建了可以同时训练两种着色输入的网络模型,设计了合适的损失函数同时约束两种用户输入,实现了可以单独或同时使用两种用户输入的着色交互方法,并通过输入相关辅助信息来保证着色结果的高质量,同时,通过实验验证了该算法的合理性和有效性。(2)本文运用残差学习的思想,在着色模型中加入残差网络模块,通过学习一个残差映射来修正原始模型的输出,进一步提高着色效果。(3)本文将基于深度学习的着色算法嵌入到着色系统原型中。在该原型上可以进行全局输入着色和局部输入着色的可视化操作,并通过该原型进行了一些列关于着色方式及结果的用户研究,进一步结合理论与实践,验证了本文着色方法的有效性和应用意义。(4)使用包含广泛类别的图像数据集,其中包含物体图像,如蝴蝶、鸟类,和风景图像,如山川、建筑,并对输入信息进行预处理,使得网络模型可以对多数类别的图像进行很好地着色。
其他文献
江阴市公共交通公司主办的《江阴公交报》创刊面世。2009年5月8日首期《江阴公交报》,公司党总支书记、经理潘磊深情寄语“我们的公交我们的报”:展示公交形象,凸显公交风采,让每
《机械基础》(第三版)是中国劳动社会保障出版社出版的中等职业技术学校机械类专业通用教材。该书包括常用机械传动、常用机构、轴系零件和液压传动四部分内容,涉及范围广,知
期刊
学习实践科学发展观,一个重要要求就是“人民群众得实惠”。联系公交的实际,人民群众得实惠就是让广大职工在企业发展的同时,与企业共同发展,在企业内部获得最大的学习机会,得到最
城市地区不仅是培育商业银行竞争优势的关键市场.而且是各银行参与竞争的主阵地,城区行必须率先改革创新.实施综合化经营.达到国际一流银行核心指标标准.从而起到盈利支柱的“排头
犬血钙浓度正常参考值为2.252.75 mmol/L,血钙浓度高于2.75 mmol/L则被认为发生了高钙血症。高钙血症是小动物临床上常见的电解质紊乱疾病之一,如原发性甲状旁腺功能亢进、恶性肿瘤都可引起高钙血症,而血钙水平对心肌细胞的影响十分显著,表现出高度的敏感性,因此患高钙血症动物心脏功能往往受到或多或少的损害。近年来,犬高钙血症病例发生率有逐年上升的趋势,但小动物中关于超声监测高钙血症对心脏
不久前,一部(或许是戏曲史上第一部)小剧场京 剧的演出,引起方方面面的关注。 “小剧场”,历来是“先锋”、“前卫”戏剧的实验室;“小剧场戏剧”,素以思维超前、手法翻新、表演切近
郭庆藩(1844-1896),字孟纯,号子滞,湖南湘阴人,晚清著名学者。庆藩致力于《庄子》研究,颇有心得,著有《庄子集释》(下称《集释》)十卷、《庄子注释》一卷、《读庄子札记内外篇》不分卷
目的 :探讨用血管超声检查技术诊断四肢静脉血栓的临床效果。方法 :对近年来我院收治的70例四肢静脉血栓患者(这些患者均经数字减影血管造影检查被确诊患有四肢静脉血栓,其中,有
“一带一路”倡议不仅是国家间政治、经济交流的新桥梁,也是凝聚不同文化的枢纽。同时,“一带一路”倡议是中国主动走向世界、与国际对话、交流、合作的新机制。海南省作为“