论文部分内容阅读
随着计算机技术的不断发展,人类的生活越来越离不开各种各样的电子产品和智能设备,各种产品越来越智能化,这极大的便利了我们的日常生活。在人工智能领域,文字识别是一个相当重要的领域,假想如果机器能够通过标准印刷的文字或者甚至手写体的文字获得信息和现实时间发生交互,这是一个多么激动人心的景象。事实上,目前这已经部分成为现实,但是目前来说,机器文本识读还存在很多不足的地方有待改进。随着人们对于生活品质要求的提高,对于人工智能的要求也越来越高,这从机器识读领域来说,即是要求更好的识别准确度和更高的识别速度,这就要求我们从算法和硬件俩个方面不断改进以获得更好的性能表现,以满足现实的要求。本文基于TI专门为图像视频处理设计的一款DSP芯片DM642为基础,搭建了一个图像采集系统,并开发出相应的图像处理应用程序,通过图像预处理,边框获取,角度估计,角度校正等一系列步骤,实现了标准印刷文字的识读,通过合理的选用硬件和对文本识别算法的改进,在识别的速度和准确度上都得到了改进,有一定的实用性。本课题主要工作量在于以下几点:(1)根据文本处理系统的实际需要,综合考虑规划硬件搭配,然后查询了高清CMOS摄像头和该图像处理芯片DM642的视频图像接口的驱动资料并认真研究,在参照多个方案的基础上给出自己的设计方案,并相应根据硬件设计将系统划分为图像采集系统,图像处理系统,图像信息反馈系统。(2)大量阅读国内外关于文档识别的图像处理算法,综合考虑速度和准确度以及硬件限制,选择合适的文档处理算法,利用近邻块法获得一个个的文字连接块,再通过粗估计和细估计获得准确的文档偏斜角度,最后,通过旋转一个个像素矩形块而不是一个个像素点来校正待识别文档图像。(3)在算法验证初期,通过在MATLAB上进行验证,测试算法的有效性和实际性能,最后,开发出能在DM642上运行的图像处理应用程序,并在搭建好的系统上测试性能,实验结果表明该系统能正确的采集图像和识别文字,并且处理速度比基于ARM芯片的同类设计都要快50%以上。(4)最后,总结了整个系统的优点对下一阶段的工作做了一定的展望。