图像文字提取及基于Android的文字识别实现

来源 :山东科技大学 | 被引量 : 0次 | 上传用户:hero616
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在我们的实际生活场景中充满了各种带有高层语义信息的文字图像,如何从这些图像中提取人们感兴趣的文字信息成为了研究者们的关注的重点。图像文字识别技术包括文字定位、文字提取、文字识别等步骤,但在具体使用Android OCR软件进行文字识别时,可以设定手动截取文本区域的方式来实现文本区域定位,而且现在有很多成熟的文字识别引擎可以应用在Android平台文字识别软件的开发上,所以文字识别率主要是与文字提取有关,因此如何对文本图像进行高效的文字提取是非常重要的。文字提取主要包括文本图像的预处理以及文字切分这两部分。本文主要面向已经定位后的文本图像(文本图像来源于书籍、室内/外提示语、餐厅菜单以及商品外包装等),针对文本与复杂背景的分割、文字切分及基于Android的文字识别应用进行了深入研究,具体工作内容如下:(1)图像预处理:对定位之后的文本图像进行图像的预处理是文字提取必不可少的一步,其主要目的是实现文本与图像背景的分割。本文对文本图像采用了灰度化、降噪处理、消除不均光照、边缘检测等处理过程,针对目标文本与图像背景分割采用了改进的基于大津法(Otsu)的双阈值二值化图像分割算法。本文设计的算法在一定程度上对有着复杂背景、不均光照等特征的文本图像消除复杂背景以及噪声的干扰,很好的完成了目标文本与复杂背景的分割;(2)文字切分:为了提高文字识别率,针对获得的文本二值化图像,本文对文字切分算法进行了深入研究。在具体的文字切分过程中,首先使用水平投影法进行行切分,然后垂直投影法计算文本图像中单个字符近似宽度值(以汉字为主),最后根据字符近似宽度值,设计可变化模板并构造模板响应函数来切分字符。相比较单独使用投影法或模板法切分文字,在一定程度上克服了左右结构汉字和粘连字符容易被误分割的问题。(3)基于Android的文字识别实现:本文以图像文字提取算法作为技术手段,设计并实现了基于Android系统的汉字识别软件;除了文字识别功能外,在该软件的设计中还增加了实时显示汉字可视化图像以及语音播放功能。
其他文献
本文主要考虑如下的二阶散度型椭圆方程зj(aij(x)ui)= зjfj(x),:x ε B1(0),其中区域B1(0)是Rn空间中一个以原点为圆心,r为半径的球.本文主要探究上述二阶线性散度型椭圆方
目前中国五大国有商业银行、十二家股份制商业银行和多家城商行、22家消费金融公司、多家小额贷款公司都开展了小额消费信贷金融服务,但基于不同消费场景和风控体系,其小额消
洋葱(Allium cepaL.)是极具食用价值的园艺作物,是百合科葱属二年或多年生草本植物。鳞茎颜色是洋葱感官品质的重要组成部分,花青苷的合成和积累会影响洋葱鳞茎颜色的形成。红皮洋葱鳞茎中的主要色素成分是花青苷,其合成受外界环境和自身遗传调控。花青苷作为植物四大天然色素之一,在花粉传播、植物抗逆、抗氧化等方面发挥重要作用。AcMYB1已被证明与洋葱花青苷的合成相关,是洋葱产生花青苷的关键正向调节
模糊逻辑是由L.A.Zadeh于1967年首先建立,是非经典数理逻辑的一个重要分支,也是信息科学与人工智能等诸多领域中推理机制的基础.模糊蕴涵作为经典二值逻辑中蕴涵算子在模糊逻
智能交通系统(Intelligent Transport System,ITS)越来越多地被人们认为能够缓解道路上的交通影响,这些影响因素包括人身安全,能源和环境等,而车辆定位是很多ITS应用的前提条
目的:本研究旨在通过观察自拟方“内异止痛汤”和“散结镇痛胶囊”对气滞血瘀证子宫内膜异位症(EMs)患者痛经症状的改善,采用痛经症状积分、视觉模拟法(Visual Analogue Scale,VAS法)对患者痛经症状进行量化评分,采用妇科B超对异位囊肿的大小进行检测,采用酶联免疫吸附实验(ELISA)试剂盒对患者外周血糖链抗原125(CA125)进行测定。评价两种治疗方案对子宫内膜异位症(EMs)
学位
最早在1807年,当时著名的法国数学家、物理学家傅立叶(Jean Baptiste Joseph Fourier)就提出了一个在后来各个领域的应用都极其广泛的理论——傅立叶变换.从1807年开始,一直
大量研究表明,成年哺乳动物脑内的某些区域终生存在神经元新生,其中最主要的两个区域是室管膜下区(subventricular zone,SVZ)和海马齿状回的颗粒下层(subgranularzone,SGZ)。
覆胶钢丝帘布作为轮胎组成结构中重要的一部分,其质量的好坏直接影响轮胎的质量。轮胎橡胶层和钢丝帘布层在成型时容易出现各种质量缺陷,现有检测技术主要依靠人工抽样检测或者利用X光检测,检测技术存在很多缺点。太赫兹无损检测技术具有安全、高效、非接触及抗干扰等优势,因此利用太赫兹检测技术实现对橡胶胶片的检测具有重要的应用价值。本文主要探讨利用太赫兹时域光谱技术实现橡胶片和覆胶钢丝帘布无损检测的技术方案。本文