论文部分内容阅读
本文研究了一种基于边缘检测的视频文字提取方法,包括视频文字检测、跟踪、颜色判断、二值化和识别等问题。主要内容如下:
⑴使用改进的Sobel边缘算子把视频帧转成边缘强度图,然后分析文字和背景不同的边缘特征,反复应用水平、垂直投影分割出文字区域。同时充分利用视频在时间上的冗余信息,对检测到的候选文字区域进行过滤,以去除误判为文字的背景块和重复出现的文字块。
⑵提出了基于连通区统计的文字颜色判断、基于局部窗口分析的灰度图片二值化,以及周边融合去噪的算法。通过OCR软件读取二值图片以得到文字信息。
⑶基于本文视频文字的检测和识别方法,实现了一个网络视频下载和检索的系统。