论文部分内容阅读
随着教育信息化工程在全国范围内的迅速推进,迈进信息化大门的教育系统对信息的需求是惊人的,特别是一线教师有了更广阔的学习资源和交流空间,而这些信息主要以网页、电子书、数码相机拍摄下来的图片资料、视频等形式存在。 在详细研究字符识别和获取屏幕图像的基础上,开发并设计了这套基于屏幕的文字识别系统。主要研究如下: 其一,本文利用图像识别技术对采集到的文字图像进行识别,它不仅可以处理磁盘中已经存在的图像,还可以实时的抓取看到的有用的文字图像,然后再根据字符识别的需要,系统在对获取的图像经过二值化、字符切分、归一化等处理后,主要使用网格特征和交叉点特征相结合进行特征提取,并建立相应的字符标准特征库。 其二,对于干扰较多、字号不同以及中英文混排的情况下引起的不能准确分割字符等问题,提出了一种改进方法:基于字符周期及识别反馈文字分割方法。在此方法中,对于行与行之间出现污点等干扰情况,采用了基于连通区域合并的行切分算法,从而更为准确的完成了文本图像的行分割;对于长标点、宽标点等干扰,采用了基于字符间距周期的字符分割算法,成功实现了对连通区域类型的判定,对于左右结构的文字则采用基于识别的字符部件合并算法。实验证实,该方法的字符分割准确率优于传统的基于投影的分割算法。 最后,设计开发了一个通用性较强的字符识别软件框架,还增加了抓图功能,让使用者可以随时把喜欢的内容捕抓下来进行识别。