基于CNN的自然场景文本检测与识别研究

来源 :山西大学 | 被引量 : 0次 | 上传用户：lipengzhangchinese

【摘要】

：

自然场景文本检测和识别技术是计算机视觉领域中的重要的研究课题,随着人工智能技术以及智能硬件设备的普及,自然场景文本检测和识别技术受到人们的广泛关注。它在汽车场景文

【作者】

：

周烨

【出处】

：

山西大学

【发表日期】

：

2020年01期

【关键词】

：

自然场景文本检测文本识别 CTPN CRNN

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

自然场景文本检测和识别技术是计算机视觉领域中的重要的研究课题,随着人工智能技术以及智能硬件设备的普及,自然场景文本检测和识别技术受到人们的广泛关注。它在汽车场景文字识别、卡证识别、票据识别、教育场景文字识别等方面具有广泛的应用背景。但由于场景文本图像背景的复杂性和文本本身的多变性,要准确地检测和识别出文本还面临着诸多困难。本文针对自然场景文本图像检测与识别算法进行了研究,具体内容如下:(1)介绍了自然场景文本检测与识别算法的研究现状,分析了场景文本检测与识别技术面临的挑战,并介绍了目前常用的算法。(2)针对CTPN网络只能检测水平和稍微倾斜方向文本的问题,提出了改进的CTPN多方向文本检测算法,并将该算法应用于多方向文本检测与识别系统中。通过对待检测图像进行多角度旋转,使用CTPN网络检测出旋转后图像中文本的初始位置,再对候选文本框进行融合,找出本文的最佳文本框。在对文本框进行融合时,使用文本框融合策略,生成旋转的矩形框来标记文本区域。将该算法在IC15数据集上进行了测试,验证了改进的CTPN多方向文本检测算法的合理性。解决了CTPN网络只能检测近似水平方向文本的问题。(3)提出了改进的CRNN文本识别算法。以CRNN为基础模型,在该模型的基础上添加了对抗网络分支,同时将传统的文本特征与深度特征融合,使得能够识别有遮挡的文本。将提出的文本识别算法采用mjsynth数据集进行训练,并在IC13和SVT数据集上进行了测试。相比于CRNN算法,在以上两个数据集上的准确率都有所提高,特别在SVT数据集上,没有约束字典情况下准确率提高了0.065。

其他文献

“四达”牌SDJ6470型系列客车

期刊

客车SDJ6470型结构性能

褚加福副厅长检查建德城防工程和河道整治工作

期刊

港口湾水电站轴插轮辐工艺

安徽省宣城市港口湾水电站发电机转子支架(又称轮辐)需要在工地现场加温后热套在发电机主轴上,采用履带式陶瓷电加热器和高温红外线电加热器进行加温,采取轴插轮辐的方案成功

期刊