论文部分内容阅读
视频中的文字作为一种高级语义特征,对视频内容的理解、索引、检索具有重要作用.本文提出了一种数字视频文字自动提取的方法,提取出的二值文字图像可输入到标准OCR软件包,得到文字的ASCII码表示.该方法充分利用视频流中YCbCr各分量中蕴含的信息,并且压缩域分析和空域分析相结合,以达到速度和精度的较好折衷.本文还实现了利用提取的文字做视频索引和检索的一个原型系统.实验结果表明,该文字提取方法能达到很高的正确率和速度.