视频文字识别技术的研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:lzmkkaa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文字识别作为模式识别的一个重要分支,愈来愈受到人们的重视。而随着图像和视频信息的迅速增长,如何利用图像和视频中所包含的文字信息建立基于内容的图像信息索引成为一个非常有意义的课题。视频是由一帧帧图像所构成的,为了识别视频信息中所包含的文字,首先根据视频以及图像处理的相关知识对视频文件进行预处理,这些处理包括利用DirectShow提取视频文件中的关键帧、利用图像变换将彩色图像变为灰度图像、灰度均衡、二值化以及去噪声等。在预处理的基础上给出了一种区分中英文与粘连文字分割的算法,先分割出文字行,然后把行文字根据算法切分成单个文字,以利于对每个文字进行特征的提取或是依据已知文字的特征来对视频图像中的文字进行识别。分割算法还根据中文和英文的不同特点先区分出中文与英文,然后分别对英文与中文进行不同的处理。对分割后文字的识别采用人工神经网络技术中的BP(Back-propagation)算法。针对BP算法存在的不足,给出一种改进的BP算法。该算法主要通过调整BP算法中sigmoid函数倾斜度α来改善BP算法。如果α取值过大,各层的输出0或1被离散,学习效果变差,反之其值选择过小,系统线性化变强,非线性能力被削弱,所以最佳值是介于两者之间。利用改进后的倾斜度得到的激励函数,使计算结点的sigmoid函数的倾斜度可以在训练的过程中逐渐调整到最优值。在普通的PC(Personal Computer)机上对包含宋体的视频图像进行识别的试验结果表明,识别的准确率比较理想。
其他文献
在异构医疗信息系统的数据交换中,各系统数据的存储和表达方式相差很大,硬件环境参差不齐,信息很难在系统之间直接交换。要实现异构医疗信息系统的数据交换,需要通讯双方就数据交
随着计算机技术的发展和应用的深入,分布式技术在构建企业级应用程序中更为广泛流行。分布式系统包含地理上分布和数据处理分布两个方面。分布式应用对于用户应该是透明的,即使
联机分析处理(OLAP)是当前数据仓库应用和决策支持系统(DSS)的研究热点。OLAP查询通常需在海量数据上进行聚集查询,并要求及时向用户提供分析数据,用以辅助决策。这种使用方式
机器人路径规划问题是研究在有障碍物的环境中,根据预定的评估标准,为机器人寻找一条从起点到目标点的最优的无碰撞路径。本文受栅格解耦法和遗传算法求解全局路径规划的原理的
随着信息技术的发展,报表已经在各个政府部门和公司扮演越来越重要的角色,报表的设计与开发也成为政府信息系统中的一个关键的技术。报表系统在国资管理平台上,对行政事业单位国
本文研究的是在纯P2P网络模型中的匿名通信系统。该系统底层对用户是透明的,系统在应用层实现。本文在研究由Chaum提出的混淆网络思想的基础上,改进了匿名节点的选择方式,使用短
本文首先分析了图像配准的意义、概念、常见配准方法及变换模型。根据课题研究的内容,图像配准可分为基于外部特征、基于内部特征和基于非图像三类方法,其中论文研究的重点是基
数据压缩技术已成为当今通信、广播、存储和多媒体娱乐等领域的一项必不可少的关键技术。然而信息膨胀、采用单一现在流行压缩软件、只是为了减少存贮空间,如果获悉此算法就达
动态纹理是移动场景的图像序列,它在时间上显示出某种稳态属性。例如流水、飘扬的旗帜、摇曳的树叶。本文在分析多种现有动态纹理模型的基础上,使用生成式模型(generative mode
随着计算机软件在安全关键领域的广泛应用,人们对软件安全性可靠性的要求越来越高。为了提高软件质量,针对软件模型的安全性分析方法一直是学术研究的热点问题。传统的状态图分