论文部分内容阅读
随着当今数字化进程的推进,多媒体以及通信行业在日常生活中的应用都有着飞速的发展,数字视频、图像逐渐成为信息交互的主流媒体,各种数字化视频与图像无处不在,对应的数据量不断增加。为了满足人们日益增长的不同需求,对数字视频图像进行处理的各种技术也有了长足的进步。当前的数字视频图像源主要是数字电影、网络视频、医学图像以及用于其他用途的监控视频,对这些多媒体数据的各种处理技术正受到广泛的重视,并且有着巨大的商业潜力。视频图像中文字检测与分割是近年来图像分析与处理领域倍受关注的研究热点。本文主要围绕视频图像中文字的检测与分割问题开展研究。主要工作包括以下三个方面:(1)论文首先对目前各种常用的文字检测算法进行了综述,比较和分析了各种方法的优缺点。(2)在视频文字检测和定位方面,本文提出依据视频图像背景的复杂度对视频图像进行归类,对视频图像文字区域进行自适应的检测和定位方法,不但保证了检测结果的精度,而且提高了算法的效率,并降低了算法的复杂度。尤其是对于复杂的背景的视频,本文进行了深入的分析和研究,根据其特点提出了基于时间域的视频帧的文字检测和定位算法,有效的排除了一些单纯依据特征无法排除的虚警区域,提高了算法检测的精度。(3)在视频文字分割方面,首先分析总结了各种常用方法的主要适用范围以及优缺点;在此基础上,本文提出了一套系统的文字分割算法,包括:投影分析缩小定位区域,判断文字块的极性,多帧融合和基于笔画滤波的分割等。论文对于上述算法经过了大量视频图像数据的测试,测试结果表明,所提方法无论在效率还是在效果方面,均取得了较好的效果。