论文部分内容阅读
可视媒体是人类获取信息、认识世界的重要载体,主要包括图像、视频、数字几何等。其中,图像和视频是当前最易获取且应用广泛的可视媒体,在人们的日常生活中扮演着非常重要的角色。多媒体和互联网技术的飞速发展极大地加速了视频、图像的获取、传播与分享,同时也对视频、图像的编辑和处理提出了更高的要求。由于视频和图像具有数据量大、结构复杂等特征,当前很多方法并没有提供较为直观的交互方式和实时的结果反馈,因此很难让用户高效地编辑视频和图像。如何根据视频、图像的具体内容和特征,设计简单的交互对其进行高效编辑,已经成为当前计算机图形学和视觉领域的研究热点。本文针对视频、图像交互式编辑与融合中的关键问题展开研究,重点研究了视频对象的高效提取、场景特征敏感的图像融合以及立体图像的深度一致性融合这三个方面内容,取得了以下研究成果:[1]视频对象的高效提取。提出了简单高效的交互手段,用户能够随着视频播放以拖动笔刷的方式逐步提取出视频对象。为了让用户在拖动笔刷时迅速得到结果的反馈,本文提出了基于3D图割的算法用于高效、准确地计算对象提取的结果,并采用基于滤波的帧间连续的透明度抠图来提升对象提取的质量。实验结果和用户体验表明,该方法能让用户高效、准确地提取出视频对象,并在视频编辑方面有着广泛应用。[2]场景特征敏感的图像融合。提出了全局特征敏感的融合方法。该方法通过综合考虑目标场景的全局和局部特征来保证融合结果的光照一致性,从而改进了传统的梯度域融合方法。为了处理梯度域融合中颜色与纹理的不一致性,本文进一步提出了基于混合边界和混合梯度的融合方法。该方法能避免不同颜色与纹理混合所产生的瑕疵,最终能够生成更加自然的融合结果。[3]立体图像的深度一致性融合。提出了一种高效的方法将2D对象交互式地融合到立体图像中。用户可以通过简单笔画编辑2D对象的视差,并且能从融合结果中实时观察到2D对象的立体效果。实验结果和用户体验表明,该方法能让用户通过简单交互生成具有高度真实感的立体融合结果,并在立体图像编辑方面有着广泛应用。