面向复杂自然场景的交通标识文本检测研究

来源 :湖南师范大学 | 被引量 : 0次 | 上传用户:WatsonWen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,自然场景文本检测已成为计算机视觉领域中的热门研究方向,交通标识文本属于自然场景文本的一种,它在无人驾驶系统的视觉感知环节中占有重要地位。尽管研究者们在交通标识检测领域已取得了很好的成果,但是针对交通标识文本检测的研究却很少。事实上,交通标识文本包含了丰富且有价值的交通信息,若能将其与交通标识的检测相结合,则可为相关应用的开发带来更大的益处。本文针对国内交通标识文本提出了一种有效的文本检测方法,该方法仅包括一个全卷积网络(Fully Convolutional Network,FCN)和一个简单的后处理步骤,特殊设计的头尾文本像素定位法使得该检测器对于尺度较长、排布稀疏的词组检测性能鲁棒。该方法在本课题组构建的国内交通标识文本数据集(CTST-1600)上进行了测试,所获得的F值为0.79。与此同时,在公共数据集ICDAR 2013和MSRA-TD500上的测试结果与相关最先进方法相比也获得了具有竞争力的结果,实验结果表明该方法在应对交通标识文本检测以及其他复杂场景文本检测具有较好的适应性。实验中发现第4章方法在应对复杂光线条件下的检测效果以及网络运行速度方面存在不足,针对上述问题,本文第5章提出了相应的改进方案,具体体现在:为应对交通标识所处环境的复杂多变性,在原网络首端加入一个图像预处理模块,它能对输入图像进行光线检测并对被判定为光线不佳的图像进行自动增强处理,从而有效提升文本检测模型在复杂场景条件下的召回率;提出利用尺度转换层替代FCN中的上池化层,尺度转换操作能够在扩大特征图的同时压缩通道至原通道数的1/4,从而达到降低网络复杂度、提高网络执行效率的目的。改进后的文本检测方法在CTST-1600数据集上所获得的F值由0.79提升至0.82,检测速度指标FPS由4.90提升至5.28。与另外三种方法对比,本章方法具有明显的综合性能优势。
其他文献
亚胺是一类重要的含氮中间体,广泛应用于生物、农业、制药及精细化学品合成中。亚胺的合成方法较多,主要包括羰基化合物和胺类的缩合、胺类的自缩合和醇胺的氧化耦合反应。而
由于太赫兹的成像高分辨率的特点和反隐身、抗干扰等优势,其在雷达成像领域具有相当的潜力。本文的研究着眼于提高太赫兹雷达的成像质量,凸显目标特征的成像方法,主要工作如
机器人抓取技术作为机器人的一项重要能力,由于工作任务的升级以及场景的动态变化对其从感知到认知、推理、决策的智能化进阶提出了要求,这使得实现机器人自主抓取服务的深层
使用一种新的多模式集成方法偏最小二乘回归(Partial Least Square Regression,PLS),利用其能完全消除多重共线性的特征来改善比湿和地面气温多模式集成预报的效果。偏最小二
随着我国经济社会的全面发展,不管是居民用电还是工业用电,对电力部门的电力需求都呈现指数式增长。而用电规模的增加,对电力需求和电力设备维护管理的要求也在不断增长。电
浮游植物粒径等级(Phytoplankton size class,PSC)是描述不同浮游植物种群功能结构和分析研究生物地球化学过程的一个重要参数。其精确反演有助于识别水体中不同浮游植物种群
超原子是一种具有特殊大小和组成的稳定团簇。它不仅可以模拟元素周期表中单个原子的化学性质,而且可以作为基本构建单元来构造新型功能材料。本文主要研究内容如下:1、我们
随着激光技术的飞速发展,激光和等离子体的相互作用成为了最热门的研究领域之一。当激光入射至冕区时,被等离子体吸收、反射和散射,在冕区附近将产生多种非线性作用,这些效应
为充分挖掘老区潜力,有力地促进老油田的可持续发展,本次研究在老区油藏精细描述的基础上,对安1-安97块太古界潜山油藏储层进行综合研究,搞清油藏裂缝的发育情况,建立可靠的
可重构机器人可以根据不同的任务需求对自身构形进行重新组合与配置,从而表现出许多传统机器人所不具有的优势。“模块化”与“可重构”作为可重构机器人设计的两大基本要求,