基于深度学习的自然场景文字识别

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:stillzhl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然场景文字识别技术是目前目标识别领域的研究热点之一,它在无人驾驶、盲人辅助系统、交通安防等领域有广泛的应用。虽然文字识别技术已经有了很大的发展,但自然场景中的文字图像背景较为复杂,且字体大小多变,文本方向倾斜,使得目前的研究方法识别效果不好。近年来,深度学习在文字识别方面应用广泛,且取得了一些成果,因此,对基于深度学习的自然场景文字识别的研究具有较高的价值和意义。首先,本文阐述了国内外相关领域的研究现状以及目前自然场景文字识别技术的难点,对相关理论知识进行了深入研究,在此基础上对基于深度学习的文本检测和文字识别算法进行了分析,并设计了基于深度学习的文字识别方案。然后,针对自然场景文字大小多变、文本方向倾斜导致的文本检测效果不佳的问题,设计了一种基于RFPN-RCNN的文本检测算法。该算法采用循环金字塔网络提取文字的多尺度特征,通过多方向窗口提取网络SRPN生成多个建议框,并采用建议框旋转模块获得倾斜的建议框,对倾斜的建议框筛选生成最终的文本框。实验结果表明,本文设计的文本检测算法能有效检测出自然场景中的文本。最后,针对文字识别算法对倾斜文本识别效果不佳的问题,本文提出一种基于TPC-EDN的文字识别算法。该算法利用CNN的自学习特性将倾斜文本修正为便于识别的水平文本,通过本文设计的EDN模型,能准确识别文本内容,其中EN模块采用密集连接网络和BLSTM能有效提取文字的空间和序列特性,生成编码向量,DN模块通过注意力机制和LSTM将编码向量转化为输出序列。实验结果表明,本文设计的文字识别模型对自然场景文字的识别率有所提高。
其他文献
最新修订的“智力障碍”定义系统,更加注重个人功能状态的改善,强调特殊教育就应该成为最有效的支持体系,帮助智力障碍儿童更好地适应社会生活。根据中度智力障碍儿童的身心
在影视作品中,出于情节摄制和拍摄需要,会不可避免地大量出现他人的作品。例如,为了展现主人公的文化修养而在其卧室墙壁上出现名家字画、艺术雕塑等。对这些作品的使用,如果被权
报纸
实践中在审理寻衅滋事罪与抢劫罪、故意伤害罪、故意毁坏财物罪的案件的时候,首先要弄清他们各罪之间的界限问题.由于上述罪名在客观方面的行为、主观方面的目的、客体以及犯
我国田径运动的多级训练体制存在着后备力量严重缺乏,教练员科研理论水平和整体素质不高,运动员运动训练与文化教育脱节,青少年竞赛制度不规范,科技服务体系不完善,经费筹措
近期,全球媒体不断曝光一个名叫“蓝鲸”的游戏,这是由俄罗斯一位心理学系大学生发明的死亡游戏。游戏的参与者被鼓励在50天内完成各种任务,包括每天清晨4时20分起床、割伤自己
报纸
以黑龙江省东北林业大学老山人工林实验站26林班白浆土栽培的红松人工林为试验地,林龄20年,公顷株数为3 240株,研究结果表明,矿质元素贮量为502.37 kg·h^-1·m^-2,
【正】传媒经济是以传播媒介为中心或为主导而形成的各类经济活动的总称。传媒经济作为一种独立的经济形式,是由以下条件决定的:一、商品经济的确立和发展是传媒经济及其理论
期刊
近年来,时滞系统研究已成为了控制理论研究的热点之一.在实际问题中,由于时滞的原因,通常会导致整个系统的性能下降,甚至是不稳定的.本文主要考虑的是广义时滞系统时滞依赖下的耗
据外报消息,东南亚房地产市场国内需求强劲,海外融资潜力大,因此吸引力不比中国逊色。东南亚国家中产阶级日益扩大,导致国内对住宅和商品房需求强劲。在印尼,买得起房地产的中层阶
商业银行同业业务原本只是银行调节短期流动性的工具,但由于它能够规避监管,扩大贷款规模、隐藏信贷资金投向和优化银行资产负债表,降低资本消耗等,在近十年迅速发展成了银行