视频图像中的文字提取技术研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:fengk9000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频中的文本为描述视频内容提供了十分有用的信息,对于构建基于内容的多媒体检索系统具有重要作用。因此,有效地提取和识别这些文字对于图像理解、视频内容分析、基于内容的图像和视频检索等领域具有重要意义。目前商业的OCR技术对于二值图像中文字的提取识别已经趋于成熟,但视频中的文字具有分辨率低、背景复杂、文字形态差异大等特点,这给视频中文字的有效提取带来了极大的挑战,限制了OCR技术的成功应用。针对这些问题,本文主要围绕如何充分利用文字的各种特性,更鲁棒地从复杂背景图像中提取出文字进行了研究,具体研究了文字区域检测、文字恢复、文字分割这三部分的算法。在视频文字检测方面,本文提出了一种基于线条分类的视频文字检测算法。首先利用Canny算子对图像进行边缘检测,然后根据文字边缘线条的特征,过滤非字符的边缘线条,并利用文字线条区域的相似性,设置综合阈值,得到最终的文字区域。该算法在边缘检测的基础上,有效地利用了文字本身的结构特征和文字笔画的线条特征对文字区域进行判别,在获得较高查全率的同时大大降低了虚警,而且对不规则排列及发生形变的文字也能够准确定位,并对光照、阴影等条件不敏感。在文字分割方面,本文提出了一种融合多种处理方法的文字区域二值化算法。首先对发生了射影形变的文字进行文字恢复,消除了射影形变对文字识别的影响,然后通过综合局部二值化,文字极性判断和连通分量分析等方法有效地过滤了文字区域中的背景,使文字区域二值化效果得到较大的提高,对具有复杂背景、受光照和阴影影响及发生了射影形变的文字都能够有效地识别出来。本文针对所提出的算法选取了四种不同类型的视频中的关键帧,并从网上收集了包括各种类型文字的图片,构建了一个实验数据集合,并对这个测试集合进行了详细而全面的实验。实验结果表明本文算法具有较高的检测和识别性能,能够比较有效地检测和识别出各种不同类型的文字。
其他文献
目的比较月经周期正常女性精神分裂症患者治疗前与健康对照组及治疗前、后血清睾酮(TSTO)、促卵泡成熟激素(FSH)、垂体泌乳素(PRL)、孕酮(PRGE)、黄体生成素(LH)及雌二醇(E26
从“女性主义艺术”这个名词的出现直至今日,人们对于女性主义艺术的关注从来都没有停止过。是女性艺术,还是女性主义艺术,关于两者区别与联系的争论也一直在进行中,众家各抒
改革开放至今,我国的外汇储备总体上呈现增长趋势,特别是1994年实行外汇管理体制改革以后,我国的外汇储备量持续快速增长,截止2009年底,我国外汇储备规模由1994年的516.2亿美
臭氧用于慢性骨关节炎是目前医学界推广的治疗方法之一,合适浓度的臭氧利用其强氧化特点使慢性骨关节炎患者疼痛减轻,延缓软骨及骨质破坏。本研究将从臭氧对软骨及炎性因子的
中国商业大片在市场需求、政府引导及西方电影影响等多重外力作用下走上了类型化的道路,初步形成了以古装动作片为主的多样化类型格局。虽然商业上取得了显著成功,艺术上却还
标识是通向品牌的入口。便于记忆及快速识别的可视品牌标识,可以促进人们对品牌的感知和认同。最好的标识在提升品牌。创造和建设一个品牌,设计扮演着至关重要的角色。设计使
电能需求的增加和环保要求的压力促进了分布式能源的发展。据文献报道,2010年之前全球累计新增发电容量的25%到30%为分布式发电。风电是无需燃料费用的可再生绿色分布式能源,
当前海量异质、快速增长的网络资源带来了“数据过剩”和“知识贫乏”的矛盾,增大了人们及时获取有用知识的难度。本文以网络环境下的异质数据源为研究对象,探寻各种数据中知
迄今为止,对儒家思想的呈现与解构一直是华裔美国文学中的一个核心命题。本论文借鉴后现代理论中的差异政治观,结合斯图亚特·霍尔关于文化身份生成性的后殖民理论,探讨华裔