图像和视频的便捷抠图技术研究

被引量 : 0次 | 上传用户:xtchen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
抠图(matting)是图像和视频处理的一项重要的技术,在医疗诊断、电影特效和家庭娱乐中,获得了广泛的应用。传统的数字抠图方法要求用户在原始图像上交互地指出确定的前景区域、确定的背景区域和不确定区域,作为初始的输入信息。这种初始信息输入图称为三分图(trimap),抠图算法在三分图的基础上进行优化。因此,三分图制作的质量将直接影响到最终的抠图结果。然而,手工制作一张合适的三分图需要大量的交互。对于一张复杂的图像,例如蜘蛛网等,制作一张最优的三分图则更加困难。如果对于一段视频序列,也逐帧地手工制作三分图,工作量更是难以想像。本文面向电影特效和家庭娱乐等应用领域,对图像和视频的便捷抠图技术展开研究,既要减少用户的交互量,又要保证高质量的抠图结果。为此,本文在如下一些方面进行了研究和探索。一、研究便捷的交互方式,使得用户从繁琐的三分图的制作过程中解脱出来:二、探索便捷的局部修改技术,使得用户可以方便地对抠图结果进行局部校正;三、研究便捷的视频抠图技术,从大尺度的视频数据中方便快速地提取出移动的前景α图(matte)和前景目标。更为重要的是,保持视频抠图的时空一致性。基于上述目标,本文的主要内容如下:第一章介绍图像和视频抠图的意义及抠图技术的演化和发展。对抠图的相关工作进行了阐述,并对其不足之处进行讨论。随后,揭示了图像和视频抠图的难点,引出本文的研究目标和文章组织。第二章提出了基于线条的便捷图像抠图系统。采用基于线条的便捷交互方式和迭代的能量最小化系统框架,提取出了高质量的前景α图和前景目标。并进一步提出局部便捷抠图技术,对全局便捷抠图结果进行局部精细。更为重要的是,由于存在狄立克莱边界条件,局部修改结果可以无缝地嵌入全局抠图中,不会产生视觉跳跃。第三章将便捷图像抠取算法扩展到视频抠图,提出了基于马尔可夫链的视频抠图算法。将视频序列分割成具有相互关系的视频帧对,构建三维的能量函数对帧对进行优化。用户只需在关键帧上指定少量的前景和背景线条,系统即可自动快速地提取出整段视频的前景α图。并保持了视频抠图的局部时空连贯性。第四章将视频体的时空编辑界面和基于线条的交互模式相结合,利用线条的体扩散算法以及自动的背景重建技术,提出了一种新的时空一致的视频抠图算法。三维能量最优化系统框架将抠图方程的零阶连续性和一阶连续性作为能量方程的先验知识,得到了全局最优解,重建出了时空连贯的前景α和前景颜色。最后,第五章对全文进行总结并展望将来的研究方向。
其他文献
介绍了VirtuoZo AAT软件解析空三加密的主要流程,结合本次设计的区域进行解析中三角测量加密,总结出在作业过程中提高精度和作业效率的一些方法。解析空中三角测量的作业流程
水上箱梁现浇段施工必须保证支架体系的安全性和可操作性,需要对支架体系进行设计和验算,并明确施工要点。板沙尾特大桥边跨现浇段水上支架采用钢管贝雷梁柱式结构体系,施工
病例1,女,64岁,因无明显诱因出现脐周阵发性针刺样疼痛半年于2010年12月1日入院,腹痛每次持续15~30 min,可自行缓解,伴恶心、频繁呕吐胆汁样物。外院曾行肠镜诊断"结肠癌"。患者
本文从思维方式、价值观念、伦理与法制等方面分析了中西方文化的主要差异,并且指出了这些差异对国际商务谈判的影响及应采取的相应策略。
语言是人类社会所共有的本质特征,思维的物质载体,它与人脑其它高级皮质功能,如知觉、注意、记忆、思维等紧密联系,受到多学科、多层次水平的关注。fMRI把神经活动和高分辨率
绿色矿业经济的关键在于剩余物质最小化、气体排放低碳化。发展绿色矿业,建设绿色矿山需要多方面的努力。对于矿山企业而言,建立剩余物质最小化存在着强有力的经济动力;对于
防水是衡量建筑质量的重要指标之一。传统防水材料及施工工艺,难以将建筑的防水、隔排气、防窜水等技术质量指标达到较理想的程度。然而,本系统解决了上述问题的同时,因其施
随着改革的不断深入,中国已经进入社会的全面转型阶段,同样也是经济发展模式、政治思想观念、社会伦理价值调整重建的关键阶段。在这一阶段,社会公共危机事件由非常态化的偶
本文把专家意见聚类法应用到投资项目风险评价指标权重的计算当中,排除了个别专家的意见,提高了指标权重的准确程度。
伴随着国家电网改造工程的进行,我国电网的综合自动化水平不断提高。传统的电磁式互感器已经不能满足电力系统自动化、数字化的发展要求,必将被新型的电子式互感器所取代,这