【摘 要】
:
在自然场景下,人们每天都会接触到特别多的图像,比如广告、宣传海报、路边指示牌、门牌号等等,在这些图像里面,包含了人们所需要的大量文字信息,通过对图像中文字信息的传递,可以使人们交流变得更加方便,也可以更好的去了解这个世界。然而,自然场景下的图像具有以下特点:文字语言不同、字体大小不同、排布方向不同、背景信息的干扰,同时图像也常常会受到光线、遮挡等外部因素的干扰,而造成的清晰度不高等等特点。传统的O
论文部分内容阅读
在自然场景下,人们每天都会接触到特别多的图像,比如广告、宣传海报、路边指示牌、门牌号等等,在这些图像里面,包含了人们所需要的大量文字信息,通过对图像中文字信息的传递,可以使人们交流变得更加方便,也可以更好的去了解这个世界。然而,自然场景下的图像具有以下特点:文字语言不同、字体大小不同、排布方向不同、背景信息的干扰,同时图像也常常会受到光线、遮挡等外部因素的干扰,而造成的清晰度不高等等特点。传统的OCR技术目前可以达到很好的准确率,然而它需要图像中文字非常的规整,背景与文字的可分开性高,所以从自然场景图像中提取文字信息是一件非常具有挑战的研究工作。根据自然场景图像的特点,采用目前广泛研究的深度学习方法,从文字检测和文字识别两个方面着手,接下来就是具体的研究工作:(1)文字检测的工作是将图像中文字区域给标注出来,而针对同一文本线上的文字,它的大小、方向、距离都是不同,所以认为预测文字的竖直方向要比水平方向更加容易,最终采用的是CTPN文字检测算法,CTPN是一个基于CNN和RNN结合的检测算法,利用CNN卷积操作提取图像特征,RNN对字符序列的特征识别。(2)完成了文字检测工作后,需要识别标注出来的文本框,本文首先采用的是卷积神经网络DenseNet进行文字识别,针对其它卷积神经的分类对比,可以发现DenseNet最大的特点在于密集连接,能够缓解一定程度的梯度消失问题,还能减少参数量,使计算速度更快,识别效率更高。最后使用CTC算法对识别出的单个字的序列进行切分和整合工作。自然场景文字识别系统在基于Tensorflow和Keras的深度学习框架上实现运行计算,根据训练和测试的过程,能够很好的识别出自然场景图像中的文字信息,和其它方法相比较,文字的识别率得到了提高,表明出CTPN+DenseNet+CTC对自然场景图像的文字识别有比较好的效果。
其他文献
阐述了节约型园林的含义、理念,并介绍了因地制宜建设节约型园林的有效措施,以期为建立节约型园林提供参考。
文章在总结中国新石器时代文化区域划分的已有做法的基础上 ,提出了中国新石器时代文化区域划分的五个方面的原则 ,并试对中国新石器时代的文化区域进行了多层次划分。通过分
为准确评估变电站(换流站)地网设计的合理性与安全性,解决地网参数解析解难以计算的问题,笔者在借鉴前人研究基础上,编写了一种可用于计算任意复杂变电站、换流站地网参数的程
随着我国本科教学工程教育专业认证的持续推进,各高等学校都十分关注学生工程实践能力的培养。通过解析工程实践能力的内涵,在分析交通工程专业特点的基础上,结合目标人才市
我国是一个水资源贫乏的国家,节水是我国的一项重要国策,但目前节水却无国家标准。介绍了编制中的国家标准《民用建筑节水设计标准》的内容框架,并就标准重点解决的问题如用
对同一样品采用双喷电解法和离子减薄法制备透射电镜薄膜样品,观察含铜钢中的ε-Cu析出相,结果表明:双喷电解法试样由于ε-Cu析出相与基体的腐蚀速率不同衍衬像反差较大,低倍观察
<正>最近,美国第一大商业银行花旗银行陷入了有史以来最大的泥潭。根据花旗集团2008年1月15日发布的第四季度财报和2007年年报,由于产生了巨额的次级抵押贷款相关损失,该行在
在过去的10年,为了解决欧盟制定的有关安全和健康方面的一些法规所产生的问题,欧洲粉末冶金行业已经做出了很多的调整。在经过对粉末冶金产业链上的企业和机构进行了大量的调
目的 探讨优质护理对髋骨骨折患者术后并发症及满意度的影响。方法 选取我院2015年1-12月收治的138例髋骨骨折患者,随机分为优质组和对比组,每组69例,优质组采用优质护理,对
花岗岩残积土广泛分布于我国的东南部地区,是一种典型的特殊土,具有遇水软化的特性。非饱和状态下的花岗岩残积土具有较高的抗剪强度,但随着饱和度的升高,其抗剪强度会急剧降