论文部分内容阅读
抠图(matting)是图像处理的一项重要技术,其目标是以遮罩形式提取出静态图像或动态视频中任意形状的前景物体,以方便将提取出来的前景物体合成到全新场景中,得到新的合成图像或视频。抠图成为图像处理的研究热点,吸引人们的关注,这主要有两方面的原因。一方面,抠图涉及到计算机视觉和机器学习的融合,为图像编辑提供基础,在工业设计和家庭娱乐等方面,有极其广泛的应用,具有巨大的商业价值。另一方面,提取任意形状的前景也是图形学和计算机视觉中非常具有挑战性的一个部分,目标形状的复杂细节、透明通道的处理、遮挡和光照改变、背景相似物的干扰等因素都使得该问题异常复杂。尽管经过几十年的研究,不同研究者提出了很多抠图算法,然而如何实现复杂环境下的鲁棒和精确地前景提取依然需要深入研究,这使得抠图具有较大的理论研究价值。本文深入分析现有抠图技术存在的问题,重点研究人类视觉感知特性指导下的自然图像抠图算法及其他若干问题。本文面向图像特效制作和家庭休闲娱乐等应用领域,将神经生物学和认知心理学中关于人类感知特性的研究成果应用到抠图算法中,尝试从这一角度出发,对自然图像抠图问题进行研究,使其在尽可能减少用户交互量的同时,获得高质量的抠图结果。本文在如下四个方面进行了研究和探索。一、从优化用户输入出发,考察视觉特性对抠图算法的影响,结合视觉注意模型,研究更为便捷的交互方式,减少用户的交互工作量:二、研究基于自然图像结构特征的三分图修正方法,降低算法对用户输入的依赖程度;对贝叶斯抠图算法进行改进,提高其对复杂图像的处理能力:三、探索以全局视觉显著性为参考的颜色样本采集方法,提高基于颜色采样的鲁棒抠图算法的准确性;四、研究基于结构特征的局部自然图像抠图算法,用以对抠图算法结果做局部修正,提高算法最终的遮罩效果。与已有方法不同,本文算法强调通过人类感知特性挖掘图像中前景目标的潜在信息,充分利用自然图像的视觉特性,在降低算法对用户交互的过度依赖的同时,提高算法的准确性。基于上述目标,本文的主要创新点如下:第一,针对包含单一前景目标的自然图像,提出了一种基于人类视觉注意模型的半自动抠图算法。单一前景图像抠图中所提的前景物体对应的正是注意模型中的感兴趣物体,本文提出了一种以注意焦点作为问题先验的抠图方法,尝试将注意模型合理的引入抠图问题中。提出包含先验指导信息的视觉注意模型,将注意焦点转移范围控制在感兴趣目标区域内。利用注意焦点序列作为图像的前景约束,能够最大限度的提供前景先验,同时避免了用户交互的无目的性。之后采用闭型优化算法求解遮罩,能够得到较高的抠图质量,实验结果表明该算法适用于前景物体唯一且连通的自然图像。第二,研究利用图像局部统计特性的抠图算法。大部分抠图算法能够取得良好效果的前提条件是用户输入三分图的精确性,然而,获取精确的三分图需要消耗大量的人力。针对三分图未知区域过大,已知信息不充分这种情况,本文提出了一种三分图修正算法,克服之前算法不能对图像结构信息建模的局限性,也降低了抠图算法对三分图精确性的要求。通过统计信息将未知区域中的若干点预先标注为确定前景和背景,对输入三分图进行修正,从而为抠图算法提供更为充分的样本。传统贝叶斯抠图是一种基于统计学习的方法,用有向高斯混合模型表示待求解区域周围的采样信息,传统贝叶斯抠图算法对每个像素点分别求解,得到的遮罩是离散的。本文根据透明度值的统计特性对原最大似然函数进行了改进,实验证明改进算法能够消除遮罩的不连续性。本算法适用于难以人工划分出精确三分图的自然图像。第三,研究基于视觉显著性的样本采集方法及基于可信度的抠图算法。提出了一种改进的鲁棒抠图算法,结合基于颜色采样的抠图算法和基于信任传播的抠图算法的优点,同时克服以往采样过程中沿区域边缘均匀采样的做法,重点采集显著样本点,从而最大限度的保证样本对的完整性。而后计算样本点的可信度,将线性假设、颜色空间距离、局部显著性等作为评判依据,选择具有高可信度的样本点来估计遮罩值,最后使用随机游走算法优化估计值。实验表明,该采样方法能够比以往采样算法得到更完整的样本对,提高了抠图算法的遮罩结果。第四,研究基于结构特征的局部修正抠图算法。提出了一种局部抠图算法,在用户给出先验信息后,首先通过核岭回归方法得到局部图像的颜色-透明度模型,之后的学习过程加入了根据图像块颜色和纹理特征得到的自适应系数,来调整目标函数中数据项和光滑项的权重。因为从图像本身的特征来看,在高对比度区域,目标函数中的数据项应该扮演更加重要的角色。本算法可用于对已有算法的抠图结果进行局部修正。实验结果显示,这种自适应的局部修正算法能够得到正确、鲁棒的结果。