基于深度学习的路牌文字识别算法的研究与实现

来源 :湖南大学 | 被引量 : 0次 | 上传用户:hydhyd112
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,我国国民经济不断提高,截止2017年底,我国汽车保有量已突破2亿辆,汽车在居民的出行中扮演了极其重要的角色。交通标志牌是一种常见的交通辅助设施,其为驾驶员提供了及其丰富的道路信息,尤其是字符型交通标志,其包含的丰富的高层语义信息对于缓解交通拥堵,提高道路交通安全具有重要的意义。计算机视觉是人工智能中一个极为重要的领域。传统光学字符识别(OCR)技术的发展目前已经趋于成熟,相对于OCR识别的规范文档图像,场景文字由于其背景复杂多变,存在光照不均、遮挡、文本方向多变等因素,其识别具有极大的挑战性,对于自然场景中文本的检测与识别近年来成为了研究热点。交通标志文本是场景文本的一种,目前国内外关于交通标志检测及识别的研究相对较少,尚未形成一个可供研究的公开统一的数据集,尤其是中文交通标志文本。研究选取字符型交通标志中的指路标志为研究对象,通过图像采集和处理建立了一个具有代表性及挑战性的数据集,提出了一种基于深度神经网络的算法对采集到的图像进行检测与识别。同时与当前流行的算法进行了比较,该方法通过提出一种全新的四边形表示回归模型,直接预测任意方向的文本包围框。通过对一些常用的文本检测、词识别和端到端场景文本识别的基准数据集进行了综合评价和比较,清楚地验证了研究算法的优势。研究进一步对现在流行的物体检测算法SSD进行了改进,使其适合于对文本对象进行检测,采用一种CNN和RNN相结合的深度神经网络CRNN对文本进行识别,同时研究提出一种新的思路,即通过文本识别结果对优化算法文本检测算法进行优化,使得整个网络端到端可训练。研究在所有的实验结果中,研究提出的算法在水平文本数据集和多方向文本数据集方面都取得了最优秀的性能,并且效率很高。实验结果表明研究提出的针对任意方向文本进行检测和识别的端到端全卷积网络,具有很高的稳定性和效率,可以在杂乱的背景下生成单词候选区。研究还在自己收集制作的数据集上进行了实验,结果显示本算法在中文多方向数据集上也取得了较好的结果。
其他文献
目的:观察不同护理干预防治腰椎压缩性骨折腹胀的疗效。方法选取我院(脊柱)骨科在2012年1月至2013年6月期间收入院的经X线片确诊为腰椎压缩性骨折患者178例,按照随机化原则分为对
目的:分析血糖、血脂异常流行病学以及相关危险因素。方法收集我院体检者共1064例,采用日立7180型全自动生化仪对其血糖以及血脂水平进行检查,并分析其血糖、血脂水平异常危险因
【正】 宫刑为中国古代五刑之一.虽然宫刑不与中国古代社会相始终,但其别称颇多.试考述如下:一曰椓刑.马端临《文献通考》卷一六二《刑一》谓:"苗民费用灵,制以刑,……劓、刵
评述了岩石动力学实验方法的进展,介绍了常用的岩石力学动载实验方法:间接法的声波法和霍普金森法,直接法的液压加载法和落锤加载法等。进一步讨论了动载下岩石压胀参数的测定,压
【正】 当前我国逻辑界,有的人根本否定辩证思维形式的存在,有的人主张从辩证逻辑中把有关思维形式辩证法的内容剔除出去,更多人则把二者混淆在一起。这都是笔者所不能同意的
在普通的、非艺术类高职学院中,声乐教学只是学校的第二课堂教学,但作为校园文化的一部分,声乐教学却显得比较重要.校园文化不仅可以陶冶大学生情操,构建大学生健康人格,全面
期刊
【正】 (一)奈良东大寺是日本有代表性的历史悠久的佛教寺院.这里有高高耸立着的十几米高的铜铸大佛像和为鉴真和尚给日本正式传戒而设立的戒坛院.此外,在这个寺院里还有叫做
化学教学对培养学生的科学态度,训练学生的科学思维方法,特别是完善学生的创新思维和培养学生实践能力,具有很重要的作用.在化学教学中,教师不仅应起到引导教育的作用,还应当
期刊
感应熔炼炉线圈外周边设置有均匀分布的导磁体,起到约束线圈漏磁向外扩散、提高熔炼效率的作用。本文以感应加热数值仿真为基础,研究了叠制结构导磁体电阻率的处理方法,分析了非线性材料磁导率线性化的求解设定问题,建立了感应加热三维谐波分析中导磁体对磁场/温度场的优化求解方法,揭示了导磁体的几何参数与结构布局对感应熔炼炉工件区域磁场和温度场的影响规律。主要研究内容和结果有:(1)根据导磁体的材料特性及电磁场的