基于图像识别的搜题系统的研究与实现

来源 :西华师范大学 | 被引量 : 0次 | 上传用户:lionschen2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的不断发展,不仅是生活、工作等,教育教学领域也随着发生了重大的变化。在线教育是教育与互联网整合下的新型的教育方式和教育模式。在线题库是在线教育一个重要的组成部分,通过在线题库我们不仅可以搜索到各种各样的考试试题及其答案与解析,还可以将搜索到的试题组成试卷,这给教师的教与学生的学带来了巨大的帮助。但是,目前在线题库只支持手工输入的搜索功能,这样影响了其搜索的效率。例如,需要搜索的试题题目较长,且不能复制粘贴,此时则需要手工输入进行搜索。虽然我们可以输入一部分作为搜索的关键词,但这样的搜索准确度不高。所以在这种情况下在线题库的搜索效率较低。针对在线题库的不足,本文提出一个基于图像识别技术的搜题系统。此系统可以实现利用图片进行搜索试题的功能。即当需要搜索的试题题目较长或不能复制粘贴的时候,我们可以对其进行截图或者用手机或其他电子设备拍照下来,然后利用此图片进行搜索,最后可以得到图片中显示的试题及其答案与解析。这样的功能对于手机用户来说是非常方便的,因为他们只需用手机一拍便可得到试题的答案与解析。本文旨在实现一个能满足利用图片搜索的、开源、稳定的搜题api系统,为在线题库或其他搜题系统提供基础功能。此系统既克服了在线题库效率低的缺点又顺应了互联网与教育教学不断整合和终身教育理念的要求,而且为用户提供了方便快捷的学习方式。本系统的实现主要涉及到图像处理、图像识别和机器学习等方面的知识。本文详细阐述了基于图像识别的搜题系统的设计与实现,并介绍了实现的方法。本系统的功能原理是,首先发出Web请求,接收到请求后对试题图片进行预处理,主要包括图像校正、图像灰度化、二值化、图像去噪等。然后对图像进行分割和字符识别。最后将识别得到的文本信息作为关键词进行搜索。最终得到试题答案与解析,然后将答案与解析返回给请求用户。本文使用django作为Web框架;利用Open CV库和Python的Image库实现图像预处理和图像分割;对于图像的字符识别,本文使用开源的Tesseract-ocr引擎进行处理,为了提高字符识别的正确率,本文利用Tesseract引擎提供的字符库训练方法进行相关字符库训练,得到了较好的识别效果;对于本系统的数据库,本文选择SQLite数据库.本文最后使用Nginx作为Web服务器对本系统进行测试,测试结果表明,本系统达到了预期的效果。
其他文献
随着城市化和工业化进程的加快,城市土地利用出现外延扩张、效益低下、粗放用地等众多问题,严重影响了城市进入现代化的速度,我国人多地少的国情,加上土地资源的大量浪费,使
<正> 本部分将讨论有关浆料分布、上浆耗能和粘弹性参数等数据,着重研究上浆率和空气湿度的影响。一、实验方法 1.上浆试样的制备: (1) 涤纶丝上浆:涤纶长丝(支数120分特,单
根据某钼矿选矿厂的建设规模、矿石性质、产品要求,设计“半自磨+顽石破碎+球磨”的SABC工艺与“中碎+高压辊磨机+球磨”的高压辊磨工艺,对基建投资费用和生产经营成本费用进
随着电力体制改革的深入推进,电力行业的竞争日趋激烈。无规矩,不成方圆。尽早尽快在企业内部构建科学合理的管理体系一直是业界人士的共识,其迫切性不言而喻,而作为管理重要
培养方向不明确,重理论,轻技能,专业能力实习薄弱,职前教育缺失是我国当前市场营销专业教学中存在的问题。应加强与企业合作,了解用人单位需求,优化专业课程设置,加强实践拭能实训。
地方立法权的"收放之争"与我国改革同步。十八届四中全会全面放开了设区的市的地方立法权。设区的市若要顺利行使立法权还需要解决提升立法质量、地方保护主义以及立法碎片化
一节好的心理活动课,要做到"准、味、度、实、美"五个方面:准——心理课的灵魂,味——心理课的核心,度——心理课的根本,实——心理课的基础,美——心理课的精髓。
我国证券发行注册制建构中,在发行注册审核权的归属安排上存在证监会或证交所的选择争议。本文建议,发行注册审核权归属证券交易所较为适宜。审核权归属证交所,就是要证交所
国有企业过度负债的原因和解决办法鞠庆麒关于企业债务负担,国际上一般是用资产负债率来评价债务负担的程度,同时也作为衡量企业经营风险大小的指标,反映企业的净资产对债务负担
采用左、右轮转速差作为反馈量,对独立轮对的摇头量进行主动导向控制,并研究控制的效果。研究表明:如果仅使用左、右轮转速差作为反馈量,只能使轮对达到纯滚线位置;但在经过