论文部分内容阅读
视频节目的字幕检测与识别是一个应用性很强的课题,构造高检测率、高识别率的检测识别系统是研究追求的目标。本文结合视频中字幕图像的特点探讨了相关问题。
在视频节目的字幕检测方面,提出了利用字幕时序信息粗定位,再利用字幕内外边缘模型精定位的字幕检测方法,充分利用了字幕图像多帧的特点。
在字幕图像的预处理方面,针对视频节目中字幕图像的背景变化丰富的特点,从实际应用出发,提出了一套快速有效的字幕图像预处理方法,消除了噪声和字幕背景复杂带来的影响。
在识别特征提取方面,借鉴前人对视觉原理及Gabor滤波器组的研究,探讨选取了符合字幕特点的Gabor滤波器组参数,通过适当的特征降维方法,提取出了区分能力较强的识别特征。
在字幕识别方面,借鉴目前较为成熟的印刷体字符识别技术,同时结合字幕识别问题的自身特点,对于隐马尔可夫模型应用于字幕识别进行了深入的探讨,同时结合统计语言模型进行字幕识别,极大地提高了识别率。通过实验充分证明了应用隐马尔可夫模型和统计语言模型进行字幕识别的优势和潜力。