自然场௿中的文本检测研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:yunkang0820
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络图片分析需求的快速增长和智能设备的广泛应用,用于获取自然场景中的文本信息的图像处理方法研究日趋活跃。作为自然场景中的文本信息获取的第一步,自然场景中的文本检测算法是其中的关键组成部分。本文以自然场景中的文本检测算法为研究课题,主要研究了自然场景文本图片合成、基于卷积神经网络的文本检测算法等,具体内容如下:  1.研究了一种改进的人工合成自然场景文本图片的算法,该算法可以快速生成大量自带精确标注信息的自然场景文本图片,有效解决自然场景文本检测实现过程中训练样本稀缺的问题;利用gPb-UCM算法和FCRN-DepthPrediction算法分别获取的图片的连续区域分割信息和深度信息,显著改善了文本贴图与背景图片之间的融合效果。  2.研究了一种基于深度卷积神经网络的自然场景中的文本检测算法,通过利用特征金字塔结构对ResNet网络进行改造, RoIAlign区域池化等方法,优化对小目标的特征提取,改进了RPN网络使其更加适用与文本目标的检测,将两者结合应用于Mask R-CNN目标检测算法的实现中,有效的提高了文本目标的检测效果。  3.通过实验讨论了数据、超参数和训练策略等变量对模型训练的影响,并在ICDAR2013比赛平台上,对比分析了本文算法与其他算法的性能差异。  综上所述,通过利用改进的合成的自然场景文本图片和Mask R-CNN算法的改进实现,本文提出的算法在通用数据集上与现有算法比较,得到了较好的结果。
其他文献
多路径效应问题一直以来就是雷达波束分辨与测角的难题之一,其中多路径效应对近地入射目标仰角估值精度的影响尤为突出。米波雷达利用波长与目标尺寸可比的特点在获得反隐身
无线传感器网络是继因特网之后,对21世纪人类生活生产方式产生重大影响的热点技术之一。无线传感器网络技术集合了嵌入式系统技术、分布式信息处理技术、传感器技术及无线通信
传统的视频编码标准均采用基于块的空间域运动估计技术来减少视频帧的时间冗余。由于小波变换在静态图像编码应用中的优良特性,基于小波变换的运动估计技术也成为了近来研究
近年来随着计算机及数字信号处理技术的发展,人机交互技术有了很大的进展,作为其中重要组成部分的语音合成技术也得到了迅速的提高。目前已有许多语音合成方法,合成语音的清晰度
通信产业的迅猛发展和通信技术的日新月异,以及经济全球化竞争环境的形成,使改进生产方式、提高运行效率、降低经营成本及改善服务质量等管理工作成为目前各电信企业经营工作
GNSS(Global Navigation Satellite System)在现实生活中正发挥越来越大的作用。作为我国自主研发的XXXX和GPS双模接收机,在军事和政治上都具有重要作用。作者按照XXXX和GPS
伴随着信息化,人们对通信的质量要求越来越高,传统的MIMO系统其传输的码速率已经不能满足人们的需求,大规模MIMO技术应运而生。虽然大规模MIMO系统提高了可靠性和传输码速率,
大数据时代的到来带来了海量的多媒体信息,人们的生活也随之变得丰富多彩。人们往往倾向于选择质量较好的多媒体信息,如清晰的图片和视频、音质良好的音乐等。然而多媒体数据
近年来随着城市人口数量的逐渐增加和人民生活水平的逐渐提高,人们对给水系统的质量与可靠性越来越看重。城市给水系统担负着为生产、日常生活给水与消防给水的重要任务。我国
交联聚乙烯(XLPE)绝缘电力电缆中的缺陷有很多种类,例如:杂质颗粒、微孔、混合不均的抗氧剂等等,这些缺陷都是导致电缆绝缘早期被破坏的原因,因此缺陷的检测水平对电缆绝缘的发展起