基于CNN的自然场景文本检测与识别研究

来源 :山西大学 | 被引量 : 0次 | 上传用户:lipengzhangchinese
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然场景文本检测和识别技术是计算机视觉领域中的重要的研究课题,随着人工智能技术以及智能硬件设备的普及,自然场景文本检测和识别技术受到人们的广泛关注。它在汽车场景文字识别、卡证识别、票据识别、教育场景文字识别等方面具有广泛的应用背景。但由于场景文本图像背景的复杂性和文本本身的多变性,要准确地检测和识别出文本还面临着诸多困难。本文针对自然场景文本图像检测与识别算法进行了研究,具体内容如下:(1)介绍了自然场景文本检测与识别算法的研究现状,分析了场景文本检测与识别技术面临的挑战,并介绍了目前常用的算法。(2)针对CTPN网络只能检测水平和稍微倾斜方向文本的问题,提出了改进的CTPN多方向文本检测算法,并将该算法应用于多方向文本检测与识别系统中。通过对待检测图像进行多角度旋转,使用CTPN网络检测出旋转后图像中文本的初始位置,再对候选文本框进行融合,找出本文的最佳文本框。在对文本框进行融合时,使用文本框融合策略,生成旋转的矩形框来标记文本区域。将该算法在IC15数据集上进行了测试,验证了改进的CTPN多方向文本检测算法的合理性。解决了CTPN网络只能检测近似水平方向文本的问题。(3)提出了改进的CRNN文本识别算法。以CRNN为基础模型,在该模型的基础上添加了对抗网络分支,同时将传统的文本特征与深度特征融合,使得能够识别有遮挡的文本。将提出的文本识别算法采用mjsynth数据集进行训练,并在IC13和SVT数据集上进行了测试。相比于CRNN算法,在以上两个数据集上的准确率都有所提高,特别在SVT数据集上,没有约束字典情况下准确率提高了0.065。
其他文献
期刊
安徽省宣城市港口湾水电站发电机转子支架(又称轮辐)需要在工地现场加温后热套在发电机主轴上,采用履带式陶瓷电加热器和高温红外线电加热器进行加温,采取轴插轮辐的方案成功
北风卷地,隆冬将至。此时的您在给自己加衣的同时,是否也曾想到跟随自己南征北战.驰骋疆场的座驾——爱车北京现代?
水平对置的涡轮增压4缸发动机对翼豹WRX来说可以说是只此一家了.排置虽然只有20L.但是其最大功率却高达165kw.最大扫矩为:300Nm.甚至比一般的3L轿车都要高出不少。
缺陷/损伤的解释是复合材料缺陷/损伤检测过程的重要一环。制作了典型复合材料缺陷/损伤实时成像检测图谱,使复合材料缺陷/损伤非常形象地、直观地表现出来,提高了检测准确性和效率
小舜江输水泵站的实际工作扬程偏低,运行工况较差,为提高机组稳定性、可靠性,改善运行工况,提高运行效益,对水泵叶轮进行了技术改造.
介绍了一种用于固体粒料粒度分级、水分烘干、具有双向运输原料及烘干产品特点的大型组合功能设备.
应用地理信息系统平台,选用组件式GIS技术,利用MapX5.0组件和高级语言VB6.0开发建立"开封市交通信息查询系统"。阐述了该系统的功能、总体结构,实现了对开封市主要设施的空间查询和空间分析及获取最佳交通线路的方法,从而满足用户的出行要求。
2010年全球药品市场销售额大概为8500亿美元,其中发达国家占据市场总额的七成,而中国、俄罗斯、巴西、印度等新兴经济体,约占两成。美国在药品销售市场中首屈一指,占全球药品销售