基于深度学习和渲染数据的目标对象抠取

来源 :山东大学 | 被引量 : 0次 | 上传用户:sbtlan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像中目标对象抠取(Object cutout)是图像处理和编辑中的基本操作。但自动化的抠取真实图像中的目标对象是一项极其困难的任务,主要是因为真实图像中包含杂乱的背景,尤其是和要抠取目标对象非常相似,这样算法很难把它和目标对象区分开。目前现有的目标对象抠取算法主要是基于低级的图像分析(亮度或纹理),本文则提出一种新的整体分析的方法,主要是考虑利用目标对象整体形状特征,具体是利用高级的图像分析即学习目标对象全局形状先验知识。具体来说,本文针对一个具体的目标对象类别(椅子),训练一个深度神经网络(Deep Neural Network,DNN)来实现该功能。输入一个矩形的图像区域,该深度神经网络输出一个概率图(Probability map,P-map)。该概率图表示对应的图像矩形区域内的每个像素点在待抠取的目标对象内部的可能性。同时本文展示该概率图可以被用于评估图像上矩形包围框(proposal)包含单个目标对象实例(instance)的可能性。在此基础上,对高质量的矩形包围框即可能性高的进一步处理,得到比较精确的目标对象抠取掩膜(mask)。基于这些,本文就可以实现一个自动且端对端(end-to-end)的流程来处理特定类别的目标对象抠取问题。本文在一些分割基准数据集上对该方法进行了评估,结果表明该方法要优于其他对比算法。
其他文献
最优化是目前科学计算中较为重要的研究分支,随着科技的发展,工程技术领域诸如通讯系统、自动控制、电力系统、机械工程、土木工程、生物工程、化学工程等产生了诸多复杂的最优
随着移动互联网的发展,虽然传统的TCP/IP网络已经能够在大范围内满足信息传输的需求,但是仍然有一部分地区的网络基础设施不是很完善。在这样的情况下使用传统的TCP/IP网络则不
随着科学技术的进步,互联网已经成为人们获取信息的主要手段。一方面,对于某一话题事件,相关的信息出现在互联网的各个分散的角落,通过人工的手段无法获知话题事件完整信息;另一方
粗糙集理论作为一种处理不确定、不精确或噪声数据的重要工具已经在多个领域,如数据挖掘、模式识别、人工智能、认知科学等得到广泛应用。近年来,基于粗糙集的属性约简成为一个
随着互联网的普及,网上的信息呈爆炸式增长。除了数量的膨胀,信息的类型也呈现了越发多样化的趋势。在多种多样的数据类型中,有一类数据可以被称作"个人档案",例如简历、个人
瞬态社会网络是指在特定时间、为特定事件、持续时间短及面对面接触所形成的社会网络。不同于在线社会网络,瞬态社会网络由于其特征,能够提供更加安全可靠的信息,但是瞬态社
随着问答社区(community-based Question Answering)的兴起,大量的问答资源在用户的交互中产生,为具有相似问题的用户解决问题提供了参照。问答资源中有一类问题称为意见选择类问
近年来,随着后基因组计划的飞速发展,蛋白质组学在生物信息学研究领域中占据的地位已不容小觑。其中,对蛋白质结构及功能起到调控作用的蛋白质翻译后修饰,更是成为该领域中的
数字媒体是现代数字时代最主要的通信工具之一。数字视频和图像已经成为最主要的信息载体。目前,主流媒体、法庭证物、时尚杂志、科学刊物、政治运动工具和互联网等越来越多
随着人工智能概念的兴起和增强现实、无人机、移动机器人、自动驾驶等行业的发展,工业界与学术界对高效率、高精度的鲁棒SLAM算法的需求越来越大,而SLAM应用中,状态估计方法的效率和精度极大地制约了SLAM算法的性能表现。目前主流的SLAM系统一般使用集束调整来进行非线性状态估计。一些系统使用了开源的通用非线性最小二乘求解器,为了适应不同类型的优化问题,这一类求解器通常采用批量式最小二乘算法,牺牲了效
学位