面向MOOC视频的快速文字检测与识别

来源 :清华大学 | 被引量 : 0次 | 上传用户:jingqihao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,MOOC(Massive Open Online Courses)大规模开放在线课程已经吸引了大量的人前来学习,同时也激发了许多研究者的兴趣,如今关于MOOC的研究主要集中在数据分析,例如退课率、通过比例和考试分数预测等。然而大家对MOOC视频本身的研究却很少,视频中的文字作为信息的主要载体,如果我们可以准确且高效地识别它们,这将对MOOC视频的检索、视频内容概括和视频分类等任务非常有帮助。文档文字,即存在于各种文件和书籍中的文字。因为它们背景简单且字体单一,所以目前关于文档文字的识别任务已经得到很好地解决和应用。场景文字,也就是存在于自然场景中的文字,包括招牌、包装和路牌等。由于其字体、尺度和背景多变等复杂因素的存在,场景文字的识别是一项比较有挑战性的任务,识别难度远大于文档文字。目前许多研究集中在场景文字的识别,但是类似于MOOC视频中的文字,它们的复杂程度介于两者之间,却很少被研究。文档文字的识别方法过于简单,因此无法满足MOOC文字识别对准确率的要求。因为场景文字的识别方法过于复杂且需要大量的计算,所以无法满足MOOC文字识别对速度的要求。因此,围绕MOOC视频中的文字检测与识别过程我们开展了一系列研究:(1)本文提出了一种快速的文字检测算法。首先,引入了基于裁剪的最大稳定极值区域(MSER)的候选字符检测算法,然后在算法流程上,不同于已有的算法,我们采用行级别的字符聚类算法替代传统的分类器对候选字符进行分类,因为这样可以减少整个算法流程的计算量。(2)为了更准确率地识别文字,本文采用了基于深度学习的方法构建MOOC文字识别网络。该网络由CNN与RNN组成,卷积神经网络(CNN)用于提取图像中的空间特征,递归神经网络(RNN)用于解决文字之间的上下文关系,即捕捉时序特征。该方法可以实现较高的准确率,但是存在识别速度较慢的问题。(3)为了解决上述识别速度问题,本文从设计精简神经网络的角度出发,提出了三种基础的原语操作,基于它们重新搭建了上述文字识别网络。实验证明,该识别网络在几乎不损失准确率的前提下,可以实现更快的识别速度。基于上述的研究,本文提出了一套面向MOOC视频的快速文字检测与识别算法,为MOOC视频内容的进一步研究奠定了基础。
其他文献
国有企业作为我国重要的经济支柱和社会支柱,其发展一直都得到我国社会各方人士的重视,但长期以来国有企业自身一直存在着一些问题,如运营效率偏低,公司法人治理结构不健全,
AVS2(Audio Video Standard II)是继AVS1/AVS+等系列后推出的新一代数字音视频编解码标准,其中AVS2-P2即《信息技术高效多媒体编码》为视频部分。其性能与同期的H.265/HEVC标准基本相当,但与上一代标准AVS1相比,其编码压缩效率提高一倍以上。作为面向于高清、超高清、高动态范围的视频压缩标准,其推动了我国信息产业的发展。AVS2获得更好的压缩效率的同时,采用
随着云计算与互联网技术的不断发展,云网融合不断深入,数据中心资源呈现异构化特点。由于应用服务类型及用户需求的复杂多样化,云环境中的负载也呈现出多样性,如何在异构环境
随着互联网规模的迅速发展,对海量的文本数据的有效处理已经成为当今社会亟待解决的任务,文本分类、情感分析等自然语言处理任务应运而生。本文致力于更有效地使用深度学习模
LCD面板生产线工程作为电子信息行业,其生产过程涉及的危险化学品虽然储存量小,但种类繁多,毒性大,生产过程中污染物排放源多,且电子信息行业一般位于居民聚集区,工程运行过
目的:探讨肺动脉成形术治疗非小细胞肺癌的安全性及有效性。总结手术操作技巧以及围术期管理和相关并发症的防治措施。方法:回顾性统计分析,收集2013年4月至2018年4月期间就诊于我科的非小细胞肺癌患者的临床资料,根据手术方式分为肺动脉成形组和全肺切除术,其中肺动脉成形组220例,全肺切除组共235例。结果:肺动脉成形组和全肺切除术组术前一般资料结果无明显统计学差异。肺动脉成形组发生术后并发症86例,
图上的机器学习是一类很重要也很普遍的任务,从微信的好友关系预测到生物蛋白质相似性判断。在这类领域,图的稀疏性是必须解决的问题。常用的做法是将图的结构进行编码,使其
直升机旋翼转动部件载荷测试,是直升机研发过程中的重要环节,直接关系到直升机的使用寿命和系统性能。针对直升机旋翼系统的转动部件载荷测试试验,开展基于FPGA的旋翼载荷应
并网逆变器作为新能源发电系统、公共电网以及本地负载之间的能量转换接口装置,承担着分布式发电(Distributed Generation,DG)系统能量的转换与控制,其性能好坏直接决定着并
适用于柔性传感器的聚合物材料在军工、医疗、制造业等领域应用广泛,但是这些材料在使用过程中由于形变易产生微裂纹,影响材料使用寿命。将“自修复技术”引入到聚合物材料中