基于深度学习的自然场景文本检测与识别方法

来源 :山东科技大学 | 被引量 : 0次 | 上传用户:star51324
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然场景文本检测与识别研究是计算机视觉领域的一个重点研究方向。现今对规整的扫描文本的检测识别技术已经达到了先进水平,但对于自然场景中的文本检测和识别,由于自然场景下字体本身和背景复杂度很高,故对于自然场景文本的检测与识别的研究仍面临技术难题,是一项具有挑战意义的课题。本文主要研究内容如下:(1)通过分析自然场景文字本身复杂多样,如扭曲变形、多颜色、字体模糊等特点,背景亦复杂多样,如背景颜色多样、图像分辨率过低、背景遮挡文字等问题。针对自然场景本身复杂度较高的特性,本文提出一种基于深度学习的自然场景文本检测和识别算法,可以对自然场景文本进行多方向、多尺度的检测与识别。(2)针对自然场景文本方向不定、尺度不一等特点,提出一种多方向自适应感知区域候选网络的自然场景文本检测方法,该方法通过对anchor机制进行改进并引入一个多方向的ROI Align池化层,可以同时检测多方向、多尺度的自然场景文本,具有较高的检测精度和效率。(3)针对自然场景文本文字和背景复杂度高而导致难以识别的情况,提出一种基于连接时间分类和注意力机制的场景文本识别方法。该方法将自然场景中的文本识别问题转换成一个序列识别问题,避免了对字符分割困难导致整体识别性能降低的弊端。同时,引入的注意力机制,可以降低网络复杂度,提升识别准确度。(4)对自然场景文本检测与识别方法由整到分的结构对本文模型效果进行验证。首先,对模型的整体检测和识别效果进行验证;其次,分别对自然场景文本检测模块、识别模块进行模块化验证。最后,通过在IC13、IC15、RCWT等多个数据集上验证,证明本文提出的自然场景文本检测和识别方法可以有效的完成自然场景文本中检测和识别任务。此外,设计了一个自然场景文本检测和识别系统,通过输入场景文本图像,实现对图像进行可视化的检测和识别。
其他文献
钙钛矿太阳能电池(Perovskite solar cells,PSCs)是一种新型薄膜太阳能电池,具有较高光吸收系数、快速载流子迁移、较长的载流子扩散长度以及可溶液加工等优点,被认为是下一代
图像的有效压缩感知依赖于对目标图像进行稀疏表示的合适字典的先验知识,在实际的自然图像重建中往往缺乏这类知识。传统的解决措施为:将现成的过完备字典用于图像重建。这类
经过40多年的改革开放,中国的城镇化进程迈入了快速发展的阶段,以城市群为主的发展模式由此产生,经济的发展促进了城市的不断扩大和持续发展。山东半岛城市群地区正处于城镇
近年来,物联网作为一种新兴的技术,逐渐受到人们的关注。无线传感器网络(Wireless Sensor Networks,WSN)作为物联网的重要组成部分,也随着物联网而飞速发展。然而,WSN相比于
融资困难是我国各地在发展经济的过程中普遍存在着的难题,如何解决债务激增与城镇化需要大量资金的矛盾是地方政府可持续发展的当务之急,而PPP模式可以实现项目风险的合理配
党的十九大报告明确指出,要全面建立具有中国特色的基本医疗卫生制度、医疗保障制度以及医疗卫生服务体系。我国的改革开放已历经40年,我国的医改也经历了40年,这期间新闻媒
随着人工智能的迅速发展,深度学习方法在图像中的应用也是越来越成熟。图像分类是图像处理技术中基础且重要的一项技术,目前也出现了很多高精度的分类算法。然而当面对恶劣天气比如雨、雪、雾时,于室外视觉系统中所获得的图像的质量会有一定的影响。本文针对雨天条件下拍摄的图像,利用卷积神经网络进行图像分类,并将计算机识别出的雨天图像应用现今成熟的带雨图像修复算法进行修复。论文的主要工作包括:利用Python爬取雨
Dan Choffnes 博士 201 5 年由哥伦大学出版社出版了《Nature’s Pharmacopeia—A world of medicinal plants》(以下简称‘Pharmacopeia’)一书。Dan Choffnes 博士多年来一
目的:通过对五香饮治疗缺血性脑卒中后痰瘀阻窍气机郁滞型顽固性呃逆的临床观察,研究其作用机制,进一步探讨缺血性脑卒中后顽固性呃逆病因病机与辨证思路,并丰富其治疗的方法。方法:患者选取来源于山东中医药大学附属医院泰安市中医医院脑病科病房,分析符合条件并确诊的缺血性脑卒中后出现顽固性呃逆的患者,辩证属痰瘀阻窍气机郁滞的患者60例,按照随机数字表法,将纳入的病例随机分为对照组(盐酸甲氧氯普胺足三里穴位注射
多机器人系统具有自适应性,并行性和可扩展性等优势,在制造、军事、教育和服务业具有广阔的应用前景。机器人之间的协同合作问题在该领域具有良好的研究价值和应用前景。机器