论文部分内容阅读
视频文本行图像识别的技术难点主要来源于两个方面:1)粘连字符的切分与识别问题;2)复杂背景中字符的切分与识别问题.为了能够同时切分和识别这两种情况中的字符,提出了一种集成型的字符切分与识别算法.该集成型算法首先对文本行图像二值化,基于二值化的文本行图像的水平投影估计文本行高度.其次根据字符笔划粘连的程度,基于图像分析或字符识别对二值图像中的宽连通域进行切分.然后基于字符识别组合连通域得到候选识别结果,最后根据候选识别结果构造词图,基于语言模型从词图中选出字符识别结果.实验表明该集成型算法大大降低了粘