论文部分内容阅读
本文围绕与MPEG-7相关的关键技术之一——视频文本检测、定位和抽取方法进行了研究,由于视频文本的检测、定位、抽取和识别受背景的复杂度、对比度、分辨率、字体大小、排列方向、字形、运动方式等因素的影响,需考虑的因素较多,算法比较复杂。本文的主要工作即是针对国内外涉足较少的视频文本检测进行了较为深入的研究,为实现如何降低算法的复杂度、提高算法的鲁棒性和准确性这一目标,本文做了如下的工作: 1.提出了一种基于边缘信息和LH的方法检测视频帧文本所在的位置,边缘检测用Sobel算子,将检测到的边缘,经强度、密度检测后,计算其LH的值,经凸台检测后,得到文本区域的定位结果。实验表明这种方法计算简单,能快速地定位文本区域,且不受文本颜色、字形等的限制。对水平或垂直方向排列的视频文本,检测和分割效果良好。 2.提出一种基于小波和LH的检测算法,采用多分辨率的分析方法,不但考虑了水平和垂直方向的高频分量,也考虑了对角方向的高频分量,用具有良好时频局部特性和变尺度特性的小波分析方法提取出不同空间分辨率、不同方向的边缘子图象后经过强度和密度检测,用LH的方法进一步定位文本目标区域。实验表明这种方法由于采用多分辨率的分析方法,可对字体大小差别较大的视频文本进行检测,且不受文本颜色、字形等的限制。对水平或垂直方向排列的视频文本,检测和分割效果良好。 3.提出用形态学进行视频文本检测的两种方法。第一种方法结合了小波多分辨率的分析方法及形态学具有几何形状分析的特点,用小波分析方法提取文本的高频分量后,用形态学的方法进行进一步的处理,这样可不受文本排列方向的限制。第二种方法是提出一种基于形态学的方法提取边缘子图像,所提取的边缘具有良好的形状保持性。在提取到边缘子图像后,再通过区域标记、连通分量分析、形态后处理等一系列步骤对视频帧进行滤波,得到视频文本检测结果,最后再对其进行二值化处理,把文本字符从复杂背景中分离出来。实验表明这种方法可以