自然场景下文字检测与识别研究与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:aminhao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然场景下的文字检测与识别技术是计算机视觉领域的研究热点,大量的研究人员对该方向进行了长期的探索,自然场景中的文字提取技术研究成果可以应用到智能城市交通系统、盲人视觉辅助系统、无人驾驶技术和工业自动化系统等领域。与传统的光学字符提取技术不同,自然场景中包含了丰富的场景信息,自然场景中的文字提取面临着字体多变、背景复杂、图像质量低等诸多难点,有效提高场景文字提取的准确率具有重要的实际应用价值。本文论述了自然场景文字检测与识别技术的研究背景与意义,对自然场景文字检测与识别技术的研究现状进行了描述和分析,重点对场景文字检测与识别算法进行了研究,设计了基于GPU的场景文字检测算法和基于深度学习的场景文字识别算法,独立开发了图像视频处理平台并对场景文字检测与识别算法进行了验证。本文主要做了以下工作:1.在场景文字检测方面,本文论述了已有的笔画宽度变换算法,并对算法存在的问题进行了分析,改进了传统的笔画宽度算法,提高了算法的检测效果。为了提升改进后算法的性能,设计了基于GPU的笔画宽度检测算法,采用了多种优化策略对算法的性能进行了逐步优化,最终算法的加速比超过了742倍;2.在文字识别方面,本文对已有的卷积神经网络进行了研究,将AlexNet网络应用在场景字符识别中,改进了已有的Alex Net模型,采用样本扩展策略扩充了场景文字数据集。利用Alex Net网络的特征提取能力对大量的数据样本进行了训练学习,并结合支持向量机的方法对提取的样本特征进行分类,改进后的AlexNet模型识别率得到了提升,识别率达到了95.7%;3.结合本文对场景文字的检测算法和识别算法的研究成果,设计开发了基于OpenCV的图像视频处理平台,该平台以DirectShow插件作为视频处理接口,实现了视频中的场景文字检测与识别,并将本文提出的算法在电影视频字幕提取中进行了测试和验证。实验证明,本文提出的场景文字检测算法和识别算法有较好的鲁棒性,算法能够实时处理自然场景视频,能自动提取场景视频中的文字信息,同时,本文提出的场景文字提取算法也能够应用在电影字幕的提取中,算法能够准确定位电影视频中的字幕位置,能够对字幕进行识别和标注,本文提出的算法有较强的研究和应用价值。
其他文献
本案发生于江苏省海安县双楼乡。一家农户的耕牛误食鼠药中毒死亡,将中毒死牛肉销售被县卫生防疫站和县标准计量局封存,在县人大、县政府的领导下,组织双楼乡政府、多管、公
<正>本文介绍了路博润(Lubrizol)、润英联(Infineum)、雪佛龙奥伦耐(Chevron Oronite)和雅富顿(Afton)这四大润滑油添加剂公司的基本情况、主要研发领域与生产情况、主要添加
研究了α+β两相区锻造温度及热处理温度对TA15钛合金大规格棒材高温力学性能的影响,以及Zr元素含量对TA15钛合金高温力学性能的影响。研究表明,两相区锻造温度较低时,棒材的
孔子曰:“知之者不如好之者,好之者不如乐之者.”现代教育学认为,激发学生的学习兴趣是提高课堂教学效率的关键.那么怎样激发学生的兴趣呢?尤其是在物理学习中如何提高学生学习的兴
系统研究了某宣龙式鲕状赤铁矿深度还原过程中煤粉添加量、造球原料粒度、深度还原保温时间及还原温度等因素对金属化率和弱磁选产品指标的影响,并对不同还原温度下的产品进
借助Citespace软件,分析了2007-2018年CNKI收录的1371篇水生态文明研究主要论文,发现水生态文明研究尚未形成紧密的研究团队,机构之间的合作也较为松散,水利系统作者和机构开
<正> 输液器是临床治疗和抢救中使用率最高的重要医疗设备,在临床经常有一些不明原因的输液反应,是否与输液器的污染有关,尚未见有关的文献报导,所以我们用了一年的时间对全
“姹紫嫣红”的礼物正悄然的进行“机制转换”。传统的礼物如花、画、具、衣、食正受到电子礼物的有力挑战。袖珍收音机、单放机、电子表、液晶电视等一大批“电子礼物”应运
<正>在深入学习宣传贯彻党的十九大精神的热潮中,百色学院根据地域优势,结合教育教学成果,选出了具有地方特色的《革命老区高校实施红色经典艺术教育的实践与推广》项目,成功
新课程标准强调学生的主体作用,强调学生的“学”,让学生参与、体验知识的形成过程,注重培养学生的创新能力.创新能力在数学教学中的表现形式之一是对已解决的问题寻求新的解法,在