基于深度学习的中文OCR算法与系统实现

来源 :中国科学院大学(中国科学院深圳先进技术研究院) | 被引量 : 16次 | 上传用户:xiaoming198877
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着图像处理技术的突飞猛进,特别是深度学习和卷积神经网络的出现,越来越多传统方法被基于深度学习的方法所替代,可是仍有许多应用性问题没有很好的解决方法。在OCR的研究领域里,基于深度学习的方法常被用来解决自然场景中的复杂问题,却少有人关注在真实文本场景中,中文字符的检测和识别的性能差强人意。针对有干扰背景下的中文检测与识别算法的系统实现。本论文主要内容包括以下几个方面:1.提出了中文干扰背景数据集的合成方法:预处理真实背景纹理素材,采用旋转、倾斜变形、Image Matting等图像处理方法,合成中文仿真数据集,增加了识别算法的泛化效果。2.提出了基于CTPN+CRNN的复杂背景下的中文检测与识别方法:CTPN适合检测水平文字的特性,将合成的数据集与真实场景的数据集结合,继续扩充检测训练集的丰富性,再对检测模型进行训练。使用合成的中文数据集对CRNN模型进行训练,解决了部分中文无法识别的问题,降低部分字符因背景干扰引起的识别错误率。3.研发了基于嵌入式的中文检测和识别系统:将本文的方法在嵌入式端上实现,进行测试和分析,设计并实现整个应用系统。本文研究传统OCR技术和深度学习应用场景中没有解决的问题;分析现行方法的不足,提出相应的优化方案;并将优化后的算法布置到嵌入式系统上,解决应用问题。
其他文献
<正> 认识罗教授是在中山大学的讲学厅里。当时,身为中大兼职教授的罗先生,参加政行系2001届研究生论文答辩后,应邀作了题为《坚持可持续发展,推动地区形象建设》的学术报告
<正> 策划,在公共关系实务中有着非常重要的地位和作用。作为公共关系四步工作法中的一个不可缺少的环节,它是公关实务活动中重要的内容之一。策划的好坏往往会直接影响到整
在我国,编辑史研究相对于编辑理论、编辑实务研究起步晚,其正式开启时间是20世纪80年代。研究发展的整体趋势是不温不火,倒也逐渐被重视;虽没有众声喧哗的热闹,倒也在编辑史
<正> 从古今中外林林总总的文艺作品中,我们领略了太多风花雪月的浪漫,也品味了不少一见钟情的激越。无论是《西厢记》中张生与莺莺一见面就互生爱慕之心,《白蛇传》中白娘子
期刊
计成所著《园冶》是中国造园史上唯一的技术专著。相比于其他古代造园文献,《园冶》的独特之处就在于,它不仅系统介绍了中国古典园林的诸多技术手法,而且将许多文人造园的思
<正> 2003年可谓是拥有上千家企业的中国乳品业的多事之秋,几家被曝光、几家被收购;几家欢喜几家忧。在这纷纷扰扰中却始终有一个品牌独树一帜、高歌猛进,它就是来自内蒙古草
<正> 公关侧重沟通协调,进而创造有利于组织发展的环境,达到塑造形象的目的。要达到这个目的,企业就必须开展相应的公关活动。 可供企业选择的公关活动形式是多样的,如公关广
本文用阳离手交换法研究了铈(Ⅲ)——硝酸根配合物的组成,在酸度为7M时,溶液中除了Ce NO32+和Ce(NO3)2+之外,还发现有Ce(NO3)3和Ce(NO3)4-两种配合物存在.它们的稳定常数分别为β1=1.
随着国家教育信息化发展战略的实施以及互联网技术的发展与普及,传统讲授为主的课堂教学方式受到很大的冲击。初中阶段的学生,对世界充满了探知欲望,而地理学科上究天文,下探
通过罗马的几个最为著名的古建筑实例:万神殿、纳沃娜广场、古罗马斗兽场、古罗马凯旋门、西班牙广场和梵蒂冈等来介绍罗马市在古建筑保护上取得的成就,同时也介绍罗马人在文