彩色视频中文本信息自动提取及识别的研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:yndlyxb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机科学、多媒体技术的飞速发展,彩色视频成为电视以及网络中最受欢迎的媒体形式。在彩色视频中,文字信息(例如新闻标题、旁白、演职员名单等等)包含了丰富的高层语意信息,是多媒体数据中最重要的线索。自动提取出这些文字,通过对它们的识别和分析,可以完成对视频高层语义的索引和检索。 目前的彩色视频文本提取识别,存在以下困难:视频图像的分辨率低,图像质量差,文本的背景复杂,字符的尺寸、位置、颜色和光照变化较大。本文从以上难题入手,对文本定位、文本增强、文本分割及字符识别进行了研究。 在文本定位方面,本文针对彩色视频中文字排列的特点,提出了一种基于Lab颜色空间彩色边缘检测的文本定位方法。该方法简单有效,鲁棒性较高。 在文本增强方面,由于视频文本一般在连续多帧出现,提出了分块多帧增强算法,首先利用有限状态机对文本进行跟踪,然后对连续多帧出现的文本进行分块增强。 在文本分割提取方面,结合数学形态学处理,采用改进的Otsu算法对文本区域进行了精确的文本分割,分割后的文本区域可以直接进行文本识别。 在字符识别方面,介绍了字符识别的基本原理和主要方法,并应用改进的BP算法实现了一种英文及数字的识别。 实验结果表明,本文提出的方法对于中英文的定位、提取同样适用,尤其对于彩色复杂背景下的文本提取、识别的效果改善更加明显。
其他文献
本文对火电机组经济性分析与节能潜力诊断的理论进行了研究,提出了进行机组节能诊断的方法,对评价机组性能的指标进行了探讨,并将所提出的节能潜力诊断理论应用于锦州电厂六号机
该文基于相似模化理论,在ICFB热态实验台上分别对大同烟煤和城市生产增圾两种燃料通过高速一次风配风比和流化倍率进行了热态实验研究.实验在前人对非均匀布风流化床的整体特
该文针对压水堆核电供热机组二回路汽轮机装置的进汽参数低、流量大、高压缸排汽采用新汽再热的特点,以等效热降理论和循环函数法为基础,对压水堆核电机组热力系统进行深入分
反标架正规化设计方法(RFN)是以复矩阵的奇异值分解为基础,以最小二乘拟合为手段,以系统的传递函数矩阵的配正为目的的一种鲁棒系统设计方法。本文基于RFN的基本原理,在MATLAB环境
该文承袭了前期对冷态两相流场和喷雾场的实验和计算的研究,对其中的冷态两相场的计算部分做了一定的修正,取得了与实验结果的进一步的吻合.在此基础上,用CFD-ACE软件数值模
本文通过对荣华二采区10
期刊
本文用有限单元法对暂态过程中100MW汽轮机高压转子的温度场、应力场进行分析计算,对应力集中的弹性等部位进行细分网格计算,找出暂态下高压转子温度场、应力场的变化规律,以次
该论文首先对此方法的原理进行了简单的介绍,之后又对这种方法进行了推广,通过一些简单的例子对诸多方法的精度影响因素进行了分析.结果表明:每种方法的精度都有很多影响因素
由Klimenko和Bigler提出的条件矩封闭(CMC)模型能有效地将湍流反应流中的化学反应作用与湍流分离开来,使计算中可以使用任意复杂的化学反应机理,获得更准确的模拟结果.该论文
该文对氟里昂12和氟里昂22的优选替代工质R134a和R32/R134a在水平光滑管内的流动凝结与流动沸腾换热特性进行了实验研究和理论计算.为了能准确计算纯工质R134a及非共沸混合工