论文部分内容阅读
现代社会已经进入数据时代,随着视频数据的爆炸式增长,人们渴望快速的找到自己感兴趣的视频内容;另一方面对电视视频等视频内容的有效监管也成为监管部门一块很重要的工作。视频字幕与视频内容有着重要的语义相关性。如果能够自动识别视频中字幕文字,那么很大程度可以解决基于视频内容的内容监管和内容检索。本文开展的研究工作是基于嵌入式平台实现的,采用的是市场上性能最好的DSP处理器DM8168。嵌入式平台与PC端相比具有更加便捷、成本更低等优点,同时开发难度也更大。本文的研究工作主要分为两块:一块是硬件平台的熟悉和视频数据链路的搭建;另一大块是字幕识别算法的开发和移植优化。字幕识别算法主要分为字幕提取和字符识别两部分。本文在分析了视频中字幕文字特点后提出了基于图像对比度的字幕提取算法,并用卷积投影法定位字幕区域。在字符识别算法中本文提取字符的线素统计特征,并用基于二元词组的后处理方式优化识别结果,提高字符识别准确率。实验证明,本文所提出的字幕识别算法可以在嵌入式平台下长时间、实时稳定的运行,并能够处理多种样式的字幕文字,具有一定的鲁棒性和适应性。在数据指标上取得了高于百分之九十的字幕检测率和高于百分之八十的字符识别率,取得了较好的实验结果。