论文部分内容阅读
随着当今数字化进程的推进,多媒体以及通信行业在日常生活中的应用都有着飞速的发展,数字视频、图像逐渐成为信息交互的主流媒体,各种数字化视频与图像无处不在,对应的数据量不断增加。为了满足人们日益增长的不同需求,对数字视频图像进行处理的各种技术也有了长足的进步。当前的数字视频图像源主要是数字电影、综艺节目、医学图像以及用于其他用途的监控视频,对这些多媒体数据的各种处理技术正受到广泛的重视,并且有着巨大的商业潜力。文字检测与图像修复是近年来图像分析与处理领域倍受关注的研究热点。本文主要围绕视频图像中文字的检测与修复问题开展研究。主要工作有以下三个方面:(1)本文首先对目前各种常用的文字检测算法进行了综述,比较和分析了各种方法的优缺点。针对现有方法忽略帧间信息的不足,本文提出了一种结合帧间信息的文字区域检测方法。所提方法通过视频图像序列在时间上的连续性来提高文字检测结果的正确性。(2)在图像修复方面,本文首先介绍了经典的Criminisi基于修复优先级的纹理性修复算法,分析了该方法的算法结构以及处理结果的优劣性。在此基础上,本文分别对该算法的优先级确定以及匹配区域的搜索两个关键步骤进行了改进,通过对比实验验证了本文改进算法在保持修复结果结构性以及视觉效果上的优势。(3)在视频修复方面,本文首先介绍了几种常用的视频修复方法,分析和讨论了各种方法的适用范围与优缺点。在此基础上提出了一种基于帧间信息的视频修复方法,重点关注视频序列的运动连续性和内容一致性。最后挑选不同种类的视频序列来验证算法的有效性,通过与一般方法的对比实验,证明了本文方法可以很好的保证单幅图像修复结果的结构一致性和纹理相似性,并且较好的保持了图像序列在时间上的连续性,具有良好的视觉效果。