基于Lucene的教育题库全文检索系统研究

来源 :东北石油大学 | 被引量 : 1次 | 上传用户:t573249005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前很多教育题库网站已具备基于数据库中的文档关键字检索的能力,但缺少基于内容的全文检索能力。全文检索基于“单词-文档矩阵”存储形式的倒排索引,可以根据单词快速获取包含这个单词的文档列表,提高检索效率和准确度,因此,针对教育题库的全文检索系统的研究是有意义的。论文基于Lucene全文检索引擎开发了教育题库全文检索系统,以高中数学题库为例实现了对教育题库内的数据进行快速、准确、有效检索。主要工作内容如下:(1)论文主要研究的内容是全文检索技术,主要对图片文本提取技术进行了研究,对开源的光学识别组件Tesseract-OCR的原理、识别流程和接口方法进行了分析。(2)对教育题库全文检索系统的需求进行了详细的调研和分析,包括业务需求分析、用户特点分析和系统功能需求分析。通过UML语言将需求转化成流程图、用例图和功能模块图等图例。(3)实现了教育题库全文检索系统,包括文档录入管理、文档内容提取、索引构建和文档检索模块。通过文件系统存储收录的题库语料,通过Lucene建立倒排索引。检索模块实现文档的排序和关键词高亮显示功能。整个系统使用MVC框架来搭建,将系统的数据、显示、业务功能分成不同的模块,使得开发过程中逻辑层次更加清晰,在后期的维护中也更加便捷。教育题库全文检索系统帮助教师和学生快速、准确、有效的检索需要的内容,促进教育题库在学生学习和教师教学中的应用。对有关部门和企业具有一定的借鉴意义。
其他文献
目的:对述情障碍与抑郁之间的关系进行验证,以此为理论基础设计一套针对述情障碍干预的团体心理辅导方案,探讨基于述情障碍干预设计的团体心理辅导对于缓解高中生抑郁状况的效果。方法:采用随机抽样的方法,随机抽取郑州市某高中高一至高三年级的学生共1196人参与问卷调查,采用TAS-20量表、CES-D量表评估研究对象的述情障碍以及抑郁得分,采用团体心理辅导干预的方法对高中生的抑郁状况进行干预,并对干预效果进
蛋白质在人类的生命活动中起了十分重要的作用,可是天然的蛋白质未必能完全满足人类的需求。通过重组和突变等方法可以产生大量新的蛋白质,根据蛋白质的属性可以从中筛选出对人类有利的蛋白质。因此,蛋白质属性预测在相关研究工作中至关重要。直观上,我们可以进行生物实验以测定蛋白质的属性,但这种方法时间和金钱上的代价都太大,基本上不可能对新产生的蛋白质一一测定。但是,我们可以相对容易地获取新蛋白质的氨基酸序列。因
含低价金属中心的金属?金属键化合物因其新颖的结构和反应活性而备受关注,而选择合适电子和空间效应的配体是合成这类化合物的关键。本文报道了邻苯二胺(H2L)配体在经脱质子化
长沙五一广场东汉简牍是近些年公布的研究秦汉史的新材料,简文中主要是长沙郡及临湘县相关的司法行政文书。长沙五一广场东汉简牍中涉及的司法官吏可分为郡、县、乡三级,其中,郡级和县级官吏可分为长吏和属吏。郡长吏有郡守与郡丞,郡守作为一郡之长,对司法案件有很大的处理权限,但实际更多地侧重于司法覆核和督察。郡丞协助郡守行政,督促司法的行事;郡府列曹属吏中,贼曹主盗贼事,同时涉及逮捕和审问犯人的工作,辞曹审理案
本论文在岩心观察描述的基础上,通过对测井、录井、地震以及区域地质资料的综合分析,对轮南地区古近系EⅠ、EⅡ、EⅢ三个油组进行标准层的识别和标定、精细地层划分与对比、
现在微波器件结构和参数的设计基本依赖于电磁软件仿真模拟。虽然通过全波电磁仿真可以获得它的性能参数,但是这种方法不仅复杂并且计算成本很高,所以研究人员提出用机器学习方法来解决微波器件的求解分析问题。常见的机器学习方法有支持向量机(Support Vector Machine,SVM)、高斯过程(Gaussian Process,GP)、人工神经网络(Artificial Neural Network
船舶海水管路系统是指从舷外泵取低温海水,输送到中央冷却器来冷却动力系统装置、调节压载水舱的管道,正如人体血脉一样维系船舶的“生命力”。然而极地航行时,船舶因动力装置运转、流体脉动以及破冰连续冲压撞击等因素不可避免会产生振动现象,其中低频次周期性振动能量大、传播远,会导致海水管内流场变化。此外,很多细小的硬质海冰颗粒透过滤器被吸入海水系统,形成海水-冰晶两相流动,容易引发管道冲蚀磨损现象。振动壁面与
前期研究表明在拟南芥中通过增强MAN3基因表达,可以增强甘露聚糖水解酶的活性,使细胞壁中的甘露糖含量增多,从而增强植株对重金属镉的积累和耐受。已有文献报道在辣椒中,MNB1
混凝土结构经常在水环境中工作,如大坝、多雨地区的铁路轨道板。环境中的自由水会因为水压和毛细作用进入混凝土内部进而形成湿态混凝土。水环境中工作的混凝土结构在其工作
纵向数据融合了截面和时间序列的信息,在生物学、医学、金融学和经济学等领域受到人们的广泛关注,而飞速发展的科技手段使人们常常能搜集到大型的纵向数据集,数据维数的膨胀给纵向数据的统计分析带来了很大的困难和挑战.充分维数折叠方法不仅能保持自变量的矩阵形式,而且不会损失回归信息,是对矩阵值型自变量进行有监督降维的一种有力手段.本文基于距离协方差函数提出了一种无模型的纵向数据充分维数折叠降维方法.当结构维数