基于图像识别技术的手机单词听写软件的研究与开发

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:hghg2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着全球信息化进程加速,提高信息处理的效率已成为当务之急。伴随Android操作系统的普及和光学字符识别技术(Optical Character Recognition,简称OCR)的研究,如何利用智能移动设备高效地录入文档信息己成为一个的热门问题。本文分析了手机成像的特点,研究了光学字符识别技术中的字符预处理、特征提取和分类识别算法。在字符预处理中依次对原图像进行了压缩、灰度处理、二值化处理、方向矫正、字符分割和归一化处理。对原图片使用双线性插值算法成比例压缩;采用OpenCV开放库的灰度权值进行灰度化;在二值化处理中对传统方法进行比较研究,针对不同图像设计了不同的二值化处理方法,并对传统Bernsen算法进行改进,对原图片和高斯滤波后的图片分别用Bernsen算法计算,用求得的两个阀值重新计算新的阀值。采用平滑游程算法和细化处理对倾斜图片进行校正;利用水平投影和垂直投影方法分割图片字符;最后采用双线性插值法将每个字符图片归一为24*36px。对结构特征和统计特征的两类提取方法进行研究,确立了本文的特征提取方案:提取54个粗网格特征向量和20个穿透特征向量,并合并写入特征文件。采用三层BP神经网络算法识别字符。为了提高算法效率,本文对网络节点数的选取办法进行改进,最后在Matlab软件中对神经网络进行仿真实验,读取特征文件并分类识别,通过实验结果验证了该算法的可行性。结合对手机光学字符识别的研究和中小学英语单词听写的需求,本文在Android环境下设计实现了中小学生单词听写软件。软件主要分为图像识别、单词听写和系统功能三部分,听写可以选择手机听写和纸张听写。该应用通过OCR技术实现从手机图片到文本的转换,利用语音合成技术实现从文本到语音的转换。单词听写软件能够直接从图片中识别英文单词并朗读听写,使用起来方便快捷,能够达到辅助教学、帮助听写的目的。
其他文献
分析了我国供暖系统热用户方面的现存问题,如水力失调造成的冷热不均,不合理运行方式造成的能源浪费,传统的观念与体制造成的供暖收费难等,提出了建立新的管理体制,加强城市供热规
目的本文主要是考察控制感、自我聚焦对享乐消费意愿的影响研究,以现有的悲伤消费效应和次级控制理论为基础,深化现有的悲伤消费效应研究,同时为次级控制理论提供论据,为享乐
苯巯基尿酸(S-pheny lmercapturic acid,S-PMA)是苯的代谢产物之一,经尿液排出量占吸收苯剂量的0.005%~0.3%,其半减期为(9.1±0.7)h〔1-2〕。在职业与环境低水平苯暴露时,尿中
学位
采用 F L A C程序对抚顺西露天矿北帮西区 W200~ W 600 高陡边坡倾倒滑移变形机理进行数值模拟分析,并对采取的抗滑桩加固工程和疏干减压工程的治理效果进行评价,为边坡整治工程设计提供技
2017年7月31~8月3日,由中国焊接学会堆焊及表面工程专业委员会主办、沈阳工业大学承办的以“面向‘十三五’的先进堆焊技术与智能再制造技术”为主题的学术会议,在辽宁省焊接
期刊
电焊机行业企业积极响应和落实“中国制造2025”战略部署,在焊接机器人及其部件研发、新产品开发、产品技术及工艺升级、企业管理和市场拓展等几个方面提质增效,成效显著.rn
期刊
指出了现行供暖收费制度的弊端,针对按户计量收费的技术要求,提出了多种适应不同情况的旧有系统改造方案和新建计量收费供暖的方案,并分别指出了其优缺点和适用范围。 Pointed
即刻早期基因c-fos是应激过程中重要的神经元活化标志,有研究证实运动训练能影响机体内c-fos基因的表达,且下丘脑c-fos基因可能与运动时下丘脑-体-肾上腺轴的功能变化以及运动
研究了La2Ni0.8Fe0.2O4+δ(LNF-02)-La0.6Sr0.4Co0.8Fe0.2O3-δ(LSCF)复合阴极材料(LNF-02-xLSCF,10≤x≤40)的电性能、电化学性能、热膨胀性能.研究结果表明,LNF-02、LSCF、