论文部分内容阅读
随着互联网的不断发展,不仅是生活、工作等,教育教学领域也随着发生了重大的变化。在线教育是教育与互联网整合下的新型的教育方式和教育模式。在线题库是在线教育一个重要的组成部分,通过在线题库我们不仅可以搜索到各种各样的考试试题及其答案与解析,还可以将搜索到的试题组成试卷,这给教师的教与学生的学带来了巨大的帮助。但是,目前在线题库只支持手工输入的搜索功能,这样影响了其搜索的效率。例如,需要搜索的试题题目较长,且不能复制粘贴,此时则需要手工输入进行搜索。虽然我们可以输入一部分作为搜索的关键词,但这样的搜索准确度不高。所以在这种情况下在线题库的搜索效率较低。针对在线题库的不足,本文提出一个基于图像识别技术的搜题系统。此系统可以实现利用图片进行搜索试题的功能。即当需要搜索的试题题目较长或不能复制粘贴的时候,我们可以对其进行截图或者用手机或其他电子设备拍照下来,然后利用此图片进行搜索,最后可以得到图片中显示的试题及其答案与解析。这样的功能对于手机用户来说是非常方便的,因为他们只需用手机一拍便可得到试题的答案与解析。本文旨在实现一个能满足利用图片搜索的、开源、稳定的搜题api系统,为在线题库或其他搜题系统提供基础功能。此系统既克服了在线题库效率低的缺点又顺应了互联网与教育教学不断整合和终身教育理念的要求,而且为用户提供了方便快捷的学习方式。本系统的实现主要涉及到图像处理、图像识别和机器学习等方面的知识。本文详细阐述了基于图像识别的搜题系统的设计与实现,并介绍了实现的方法。本系统的功能原理是,首先发出Web请求,接收到请求后对试题图片进行预处理,主要包括图像校正、图像灰度化、二值化、图像去噪等。然后对图像进行分割和字符识别。最后将识别得到的文本信息作为关键词进行搜索。最终得到试题答案与解析,然后将答案与解析返回给请求用户。本文使用django作为Web框架;利用Open CV库和Python的Image库实现图像预处理和图像分割;对于图像的字符识别,本文使用开源的Tesseract-ocr引擎进行处理,为了提高字符识别的正确率,本文利用Tesseract引擎提供的字符库训练方法进行相关字符库训练,得到了较好的识别效果;对于本系统的数据库,本文选择SQLite数据库.本文最后使用Nginx作为Web服务器对本系统进行测试,测试结果表明,本系统达到了预期的效果。