基于笔画特征的多方法综合视频文本提取算法研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:chenwu2005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像视频中的人工文本包含了大量重要信息,是作为对图像视频内容的说明、解释及补充。由于语义鸿沟(Semantic gap)的存在,造成计算机难以对视频内容信息进行直接提取。因此在视频和图像大量充斥于网络的今天,视频文本信息的提取和识别显得尤为重要。文本的准确提取,不仅可以使得光学文字识别系统效果更好,用于视频分析检索,也可以使得图文分离,用于网络互动电视领域。文本提取的实现包括文本检测、文本定位和文本分割三个主要步骤。本文在文本检测和定位步骤中引入了当前最新的笔画特征方法。针对原有笔画滤波方法由于字符尺寸变化而发生效果下降甚至失效的情况,本文提出了笔画滤波器设计及滤波处理流程的两项改进方法。通过实验比对明显改善了文本检测和文本定位效果。在笔画特征提取的基础上,本文研究设计了对应于笔画特征的检测和定位方法。在文本检测中,采用直方图非线性变换和区域块标记的方法,使得富含笔画特征的潜在文本区域像素深度突出,以块区域门限进行检测。在文本定位过程中,本文致力于将笔画特征融入已有的文本定位方法中。主要采用投影分析和支持向量机块分类方法。在原有的基于边缘特征的投影分析基础上,本文对其处理过程加入了标量量化、离散余弦变换投影和半图像投影这三种主要处理算法。使得投影分析能够将笔画特征丰富的区域准确定位,而又能排除纹理复杂的背景区域。在支持向量机算法研究上,本文主要采用文献[26]所提出的基于笔画特征的支持向量机特征向量提取方法。利用此特征向量训练出的支持向量机分类器在笔画特征的描述上效果好于直接使用像素深度作为特征,本文对此进行了比较实验。利用支持向量机分类器,对候选文本块进行细化,主要包括收缩、合并和扩张三种处理,使得文本块更加准确反映实际文本存在区域。通过实验,上述算法流程取得了较好的检测定位效果。在文本分割步骤中,本文将经过准确定位的文本块进行基于模型的像素分割,利用混合高斯模型逐个像素判断其是否属于文本像素。该过程的实现需要提取部分文本像素作为训练样本,本文设计种子填充法和笔画梯度模型法相结合的文本初步分割,以此提取样本像素。在样本特征向量选取上,文本提出结合颜色和纹理的混合建模特征,其中纹理特征通过小波变换获得。通过实验,本文的提取结果可以获得较好的OCR识别率。
其他文献
水工环作为现阶段地质情况研究的综合性学科,其对于水文地质、工程地质以及环境地质等各方面的研究具有积极的促进作用.随着越来越多的先进技术和设备被应用于水工环地质研究
移动互联网行业的飞速发展,使得移动用户数量猛增,而WiFi接入是无线用户上网的首选方式。越来越大的数据量,日新月异的业务需求,使得无线接入点的功能越来越复杂,结构越来越
认知无线电被认为是缓解无线频谱资源稀缺问题的一个行之有效的技术,在认知无线电上发展而来的认知网络,是目前的研究热点。本文针对认知网络的中继选择与信道分配问题进行了
雷达信号识别技术是电子侦察与对抗的重要研究课题。本文在高频地波雷达背景下,对高频地波雷达常用的两种信号形式,即线性调频信号和二相编码信号,进行了分析和识别,并完成了
相对于传统平面视频,立体视频包含了更多视角的数据信息,会造成数据量成倍地增长。这就给立体视频的存储和传输环节带来了极大的困难。高效的立体视频编码技术以及相应的网络
随着合成孔径雷达(Synthetic Aperture Radar,SAR)系统应用领域的拓广,要求SAR系统可以在更加灵活多样的模式下工作,具有更高的分辨率,在更为严酷的条件下仍然可以获得较为满
随着电力需求的快速增长,电能供应越来越紧张,能源也在不断的消耗。新型电网结构——智能电网,可以有效的提高能源安全与利用率,提高电网的稳定性与防灾能力。中国国家电网公
市政道路工程建设作为交通的重要内容,为了保障其安全运行,必须在市政道路工程建设过程中做好监理工作,同时为了提高市政道路工程施工质量,要对其监理合同、设计图纸、材料质
数字视频压缩技术的产生和发展具有深远的意义,它使庞大的视频数据的存储和传输成为了可能,使数字视频业务得以广泛的发展。目前,SDTV数字电视码流传输都是以MPEG-2压缩方式
在经济社会高度发达的今天,城市化进程的不断加快,极大地促进了建筑行业的繁荣,也推动着建筑工程相关技术不断进步和发展.结构设计是建筑工程的关键环节,其质量水平直接关系