基于深度学习的教育文本检测与识别

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:hopelesscpu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文字是人类社会信息传承的载体,充斥在人们的日常生活之中,但文字一般依附在图片之上,文本识别与文本检测则是将图片理解成为文字的关键性技术。其中,文本识别与文本检测被广泛应用到医疗、教育、文档数字化等领域中,属于热门的模式识别研究领域。另外,教育文档是一种特殊的手写文本场景,具有字符擦除、文本行补充、字符/短语切换、背景噪声、字号不均匀、文本长度不平衡以及版面复杂等文本处理的经典难点。本文寄托于教育文档场景,研究了基于深度学习的手写文本检测与识别技术。本文的研究与创新主要包括:1.文档检测任务:本文分别对单阶段文本检测模型与双阶段文本检测模型进行探索与改进,其中改进点包括了多特征融合,先验框聚类,加入长宽比预测支路和角点预测支路等。其中多特征融合提升了网络特征的质量,先验框聚类和长宽比预测支路降低了文本框回归难度,角点预测支路缓解了极致长文本回归时感受野不足的问题。2.文本识别任务:本文构建了一个囊括常见文本识别难点的教育试卷数据集,并针对难点,构建了一个多尺度全卷积残差递归网络。其中,多尺度感受野支路使网络提取特征的感受野能够较好地覆盖中文、数字和标点符号,以提高识别效果,另外,实验也证明了多尺度感受野特征之间使用相乘的方法进行融合效果较好。随后,本文提出了一种分区间贴白的数据预处理方法,能在不降低系统性能的前提下降低模型的训练时间。3.端到端文本检测与识别:目前文档处理最为常见的方法是将文档检测与文本识别分为两个任务进行,但这可能会导致只能获得次优解。对此,本文提出了一种用于脱机手写段落识别的快速端到端系统,称为对抗特征增强网络,该系统由五个部分组成:用于鲁棒特征提取的共享特征提取器,用于进行文本检测的文本检测分支,用于感兴趣区域特征提取的Ro IRotate,用于文本检测和识别分支联合特征学习的对抗特征学习网络,以及用于文本转录的文本识别分支。实验证明该系统在性能与速度上都获得了优秀的成绩。
其他文献
荧光传感器由于具有特异性强、灵敏度高和操作简便快捷等优点,现已广泛应用于环境化学、生物化学和医学诊断等学科中。由于剧毒性、持久性和生物富集性等特点,汞被认为是环境
图像超分辨率通常是指以低分辨率图像为线索,经过推理计算获取边缘清晰、细节合理的高分辨率图像的过程。本文主要对以单幅图像为输入的情况进行研究和改进。由于清晰明确的
水声传感网络采用声波作为主要通信方式,是当今应用较为广泛的水下组网方式。然而由于水声信道具有长和多变的时延、窄带宽、多径效应等问题,水声传感网络的发展面临严峻的挑
癫痫(Epilepsy,EP)是一种常见的以短暂性中枢神经系统功能失常为特征的脑部疾病,具有反复发作和难以预测等特点。癫痫发作不仅严重影响癫痫患者的正常生活,而且给患者的家庭
为满足日益增长的终端设备的接入需求,802.11工作组提出IEEE 802.11ah标准来支持大规模设备的接入。然而,大规模设备同时接入网络,会导致严重的信道冲突。为此,802.11ah在媒
在写作的过程中,错误是很常见的。对写作纠错反馈的研究一直都是二语习得领域的一个重要问题。写作是学生必须掌握的一门技能,同时也是教师在英语教学过程中重要的一部分。在英语教学过程中,写作纠错反馈扮演了非常重要的作用,它也是学生输入的主要方法,也是语言输出的基本保证。书面纠正反馈的效果直接影响学生写作水平的提高,也反映了教师的教学效果。虽然国外关于学生写作纠错反馈的偏好与教师实践进行了大量的研究,但是中
目的:测量并根据右主支气管(RMB)长度,预测支气管封堵器(BB)用于左肺单肺通气(OLV)时的临床效果,为麻醉医师合理选择BB进行肺隔离提供理论依据。方法:选择择期行胸腔镜下右肺叶切除术的患者46例,ASAⅠⅡ级,男女不限,年龄3070岁,BMI 1929kg/m2。根据患者术前胸部CT扫描图像,利用气道多平面重建(MPR)技术测量RMB长度,将RMB长度≤1.5cm的患者纳入A组,将RMB长度
迁移学习自机器学习研究之始就备受关注,其旨在令算法获得如图人类举一反三一般的强泛化能力。领域适应是迁移学习的其中一个分支。给定两个相似性较强但样本分布不同的领域,
近年来,随着网络技术的蓬勃发展,数据以数据流的形式大量产生。对于数据流的研究受到越来越多的学者重视。与此同时,在传统的机器学习分类框架下,每个实例分配一个单独的标签
国家癌症中心发布的最新一期(2019年1月)的癌症统计数据显示,结肠癌(colorectal cancer,CRC)的发病率在女性和男性患者中分别位列第三位和第四位。虽然目前抗肿瘤治疗的发展迅速,手术,化疗,靶向治疗及免疫治疗等治疗手段的综合应用使结肠癌患者的生存期得到延长,但是,总的获益仍然有限,尚不能满足人们对于预后的期待。目前对于肿瘤的研究已经进入基因和分子水平。探索肿瘤发生发展过程中的分子