复杂背景图像中的文字提取技术研究

被引量 : 0次 | 上传用户:lw4564
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像和视频中包含的文字信息是理解图像和视频内容的重要线索,有效地提取这些文字信息对基于内容的图像信息检索系统来说是一项重要的技术。由于图像和视频中的文字通常叠加在复杂的背景之上,背景成分的干扰使得现有的OCR技术难以识别出这些文字,从而限制了OCR技术的成功应用。因此,如何从具有复杂背景的图像和视频中提取文字信息成为一个重要的研究课题。对于复杂背景中的文字检测,本文使用了多尺度的小波变换特征和标记算法相结合的方法。首先,应用小波半软阈值法去除图像噪声;然后利用Mallat塔式分解方法获取图像的高频特征信息,并计算得到各分量的特征能量。本文对特征能量的阈值选取方法做了改进,根据图像中文字的特点使用双阈值法检测文字,实现文字的粗定位;最后,使用标记算法对文字进行细定位,从而将候选文字像素连接成为完整的文字区域。实验表明,该方法能够快速、准确地检测出图像和视频中的文字。在检测出图像中的文字后,本文采用非监督参数估计方法建立高斯混合模型进行文字分割。首先利用改进的“边缘对”采样方法,在Canny边缘检测结果的基础上,通过变尺度法实现对“边缘对”之间的像素采样;然后,对采样像素建立HIS颜色模型,并使用HIS颜色模型中的色度分量作为特征;最后,本文对像素概率计算方法做了改进,提出通过计算像素区域概率的方法分割文字,即根据色度相似的像素其高斯分布概率相同的特点进行快速分割,这样可以避免以往逐个计算像素概率导致计算量过大的问题。这种先采样后利用区域概率的分割方法大大提高了文字分割效率。最后,研究了字符分割和识别问题。本文采用投影法分割字符,该方法是通过从上至下,从左至右扫描图像,将图像中的文字分割成可以输入OCR识别系统的单个字符。在字符识别中,本文没有使用单一的结构特征或者统计特征,而是结合了两者的优点,将每个字符对应到横、竖、撇、捺四个笔画子方向上,然后计算网格笔画向量作为特征,并应用最近邻法对向量进行分类来识别字符。实验表明,该方法能够取得满意的识别结果。
其他文献
一、催化剂活性下降原因分析1.积碳:丙烯是碳氢化合物,在高温下分解成碳和氢,碳沉积即催化剂使用过程中逐渐在表面上沉积一层含碳化合物,减少了可利用表面积,引起催化剂活性
民生问题既是个人及家庭的生计问题,又直接影响乃至决定国家的发展进步。市场经济国家经验告诉我们,解决民生问题,必须将有关民生的制度安排纳入社会制度体系的结构之中,其中
期刊
目的探讨莫西沙星联合舒普深治疗支气管扩张的临床疗效。方法方便选取该院2016年12月—2017年12月期间收治的120例支气管扩张患者作为研究对象,随机分为观察组(莫西沙星联合
随着半导体制造工艺的快速发展,各种数据采集系统的集成度及转换精度越来越高,模数转换器(ADC)作为打通模拟世界和数字世界的桥梁,在数据采集系统中具有重要的地位,因此要求A
技工学校作为我国职业教育的重要组成部分和开展职业培训活动的主体,肩负着职业教育与培训的重要使命。随着终身职业培训体系的建立,技工学校的内涵发生了根本的转变,它将从
语文具有很强的人文性。所以,语文教学离不开情景预设:阅读教学中,我们或联系时代背景,让学生理解文章的中心思想;或根据语言环境,让学生推断字词句的含义;或通过比较和归纳,
本文针对铁路道岔长期得不到稳定养护从而影响列车运行速度的现状,通过开发道岔稳定车,同时满足正线、道岔稳定作业需求.填补了国内铁路道岔稳定养护的空白,为铁路高速化发展提供
大数据背景下,立足初中英语教学需要,研究精准化、个性化学科教学以实现学生学科素养的有效提升正成为初中英语教师着力研究的主题。本文从这一研究方向的意义出发,结合案例
任何研究工作都要建立在前人的工作基础之上,还要建立在一定的实践活动基础之上,这种实践或者是研究者的直接实践体验,或者是他人的实践活动的间接总结,就现代教育技术的应用
本研究以中药苦瓜(Momordica Charantia L.)的干燥未成熟果实为原料,采用乙醇提取,大孔吸附树脂、氧化镁纯化除杂,盐酸水解和硅胶柱层析分离,分离得到4个化合物,通过理化常数