【摘 要】
:
视频图像中的文本包含许多有用的信息,对视频文字信息的提取能够应用于基于语义的视频检索和浏览系统。尽管传统的文字识别已经取得很大的成果,但是大多数只能识别印刷在纸张
论文部分内容阅读
视频图像中的文本包含许多有用的信息,对视频文字信息的提取能够应用于基于语义的视频检索和浏览系统。尽管传统的文字识别已经取得很大的成果,但是大多数只能识别印刷在纸张上的文字。与传统的文档文字相比,视频文字受背景的复杂度、对比度、分辨率、字体大小、字型等因素的影响,使得视频图像中的文本检测和提取仍是一个具有挑战性的课题。本文主要研究视频图像中的文本的检测和提取方法,课题研究的重点主要有三个方面:文本特征的提取、分类器的设计和文本区域的后期处理。在文本特征提取方面,本文提出了两种方法:一种是基于边缘图像的统计特征的提取算法,另一种是基于小波变换的纹理特征提取算法,使用滑动窗口扫描图像提取得到两类特征向量;选用支持向量机作为本文的分类器,使用前面得到的特征向量训练得到了文本分类器,实现对视频图像中的文本区域的初步定位。在后期的处理中,使用形态学的方法,去除误检的噪声区域,得到最终的文本区域,通过在原图像上做映射处理,提取得到文本区域。由于视频的低分辨率,本文首先对提取得到的文本区域进行增强处理,然后对文本区域进行二值化处理后送入字符识别软件识别得到视频中的文字。本文把上述的方法用于新闻视频中的文本检测,通过实验发现,该方法可以很好的提取出视频中的文字。
其他文献
高阶Voronoi图是普通Voronoi图的一种重要推广,在解决平面点集多个点的邻近问题中有着广泛的应用。然而,以往的高阶Voronoi图生成算法构造代价较高,时间复杂度较大,因而限制
粗糙集理论是一种处理不确定、不完备和不精确数据的数学理论工具,在数据分析与处理领域有着广泛而重要的应用。生物信息学是一门结合了数学理论、计算机科学与生物学知识的
目前可重构计算技术已成为计算系统研究中的一个新热点。作为一种新的体系结构,可重构计算同时具有软件的灵活性和硬件的高性能,在嵌入式系统和高性能计算等领域获得了越来越
多传感器遥感图像的信息融合可以克服单一传感器获取图像的限制,提高遥感图像分类精度,增强计算机自动解译的能力,减少遥感图像后处理时间,提高对地物变化的监测能力。目前遥感技
冠状动脉血管提取、血管中心线提取以及血管狭窄度测量是医学图像处理与分析中的研究热点。本文结合尺度空间理论,研究了基于CT数据的冠状动脉计算机辅助诊断(CAD)定量分析方
近年来网络的高速发展,信息呈爆炸式增长,模式匹配是内容过滤和信息检索的核心技术,成为计算机应用和信息安全领域中的重要研究方向。对大规模中文模式匹配,已有模式匹配算法
步态识别作为一种新兴的生物特征识别技术,目的是通过人走路的姿势实现对个人身份的识别和认证,它是远距离情况下最有潜力的生物特征识别技术之一,因此已经被广泛地应用在智
生物特征识别技术是利用人体本身所固有的物理特征或者行为特征,通过图像处理和模式识别等方法来鉴别个人身份的技术,具有广泛的应用前景。当前的生物特征识别应用大部分为基
在网络技术快速发展和网络应用不断普及的同时,网络安全成为关系国计民生的重大问题。各种安全解决方案,如防火墙技术、入侵检测技术、防病毒技术和安全审计技术等等得到了广
基于角色的信任委托管理系统是分布式证书管理系统中一个重要的授权管理解决方案,也是计算机安全领域的研究热点。信任委托管理系统的一个重要功能是授权查询,即一个实体是否