基于区域建议的自然场景文本检测方法的研究

来源 :内蒙古工业大学 | 被引量 : 0次 | 上传用户:JK0803_chenjiehua
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然场景中的文字是人工智能体认知环境的重要信息来源。对自然场景中的文本自主进行检测是人工智能体应具备的基础功能,也对具有自主感知环境和自主学习能力的智能体的应用具有重要的意义,将文字从自然场景中检测出来并依据场景环境和文字内容,推理有效信息是自主智能体适应环境和自主学习的基础。近年来,自然场景中的文字检测是机器视觉发展的关键点,文字检测技术也从原始的传统方法发展到现在以深度学习为主流方法,依靠区域建议和图像分割的方法在深度学习中使用最为广泛。本课题以区域建议技术为基础,对自然场景中的文本检测方法进行研究,主要内容有:(1)自然场景数据集的建立:查阅公开的自然场景数据集,筛选出包含规则文本和圆弧形文本两种不同类型的数据集图片,然后对所有规则文本图片中的文本位置进行人工标注,生成.xml的标注文件,构建一个包含规则文本图片和.xml标注文件的自然场景规则文本数据集,最后再对所有的圆弧形文本图片进行裁剪,裁剪后的图片中仅保留一个圆弧形文本,将标签文件重新选择后存放于.txt标注文件中,构建一个包含圆弧形文本图片和.txt标注文件的自然场景圆弧形文本数据集。(2)规则文本检测方法的选择和改进:针对自然场景规则文本的特征选择了现有基于区域建议的检测网络—Faster R-CNN,首先测试该网络对规则文本数据集中文字检测效果,然后将原网络的特征提取部分改进为Res Net50,同时将ROI Pooling替换为ROI Align,对网络中的参数进行重新的调配,接下来测试改进后网络对规则文本数据集文字检测效果,最后将两者的检测效果进行对比发现:改进后网络相比原网络在综合评价指标(F1)中的得分提高了42%。(3)圆弧形文本检测方法的选择和改进:首先针对自然场景圆弧形文本含有的特征选择了基于区域建议的检测网络—SLPR,然后对网络的结构进行了改进,将SLPR网络中的提取最小文本检测框部分替换为本课题上述章节中改进后的Faster R-CNN网络,接下来同时把两种网络在自然场景圆弧形文本数据集上进行训练和测试,最后比较两者对圆弧文本的检测效果发现:改进后网络对圆弧形文本检测的完整性要高于原网络检测的完整性,还将综合评价指标的得分提高了1.5%。
其他文献
移动互联网和无线通信技术的发展和普及,催生了大量计算密集和时延密集型应用。移动设备(Mobile Devices,MDs)因其计算资源和电池容量的限制,不能满足新型应用的性能需求。而现有的移动云计算技术需要将待存储数据和待计算任务远距离传输到云端,会产生较高的时延。移动边缘计算(Mobile Edge Computing,MEC)技术可以利用无线通信技术将待存储数据和待计算任务卸载到附近具有空闲资
随着社会的发展和进步,人与人之间的沟通交流变得愈发频繁,而拥有一种可以跨越地域限制、打破语言障碍的沟通方法就显得尤为重要。然而,大数据时代的到来,给利用传统人工翻译方法处理海量语言信息的工作带来了极大的困难。机器翻译技术的出现顺应了时代要求,且机器翻译技术的应用离不开大量高质量平行语料库的支撑。面对蒙语这种小语种语言,由于其使用范围较小且蒙古族经济文化发展相对缓慢等原因,使得高质量蒙汉平行语料的收
几何分辨率和距离测绘带宽是星载合成孔径雷达(SAR)的两个最为重要的性能指标,但是在传统单通道SAR系统中,受最小天线面积的限制,两者无法同时提高,难以满足高分宽测遥感领域对地观测任务的需求。多孔径成像体制是星载SAR实现高分辨率宽测绘带最有效的途径之一。方位多波束体制和距离多波束Staggered SAR体制是目前国内外多孔径体制SAR的研究热点,论文围绕这两种体制的系统设计与信号处理方法展开研
弧形阵列天线突破了常规线性阵列天线观测视角单一的限制,能够实现对周围环境实时、全方位、高分辨率和大视场观测。同时,弧形阵列天线阵面可以安装在飞行载体表面,不仅可以有效扩展雷达天线孔径和扫描范围,还可以降低或克服对雷达观测平台的空气动力学影响,弥补传统阵列的不足。副瓣电平是雷达天线重要指标之一,较高的副瓣电平易导致天线功率效率降低和接收信号质量下降。本课题主要对低副瓣弧形阵列天线优化方法展开研究,主
近年来,一些恐怖分子和极端势力经常在火车站、飞机场等人流密集的地方开展恐怖袭击活动,给人民的生命健康和财产安全带来巨大损失。金属探测器、X光安检仪等传统的安检手段在检测物品的种类,乘客隐私的保护,安检通行的效率等方面存在或多或少的问题。随着毫米波集成器件和高性能处理器的大力发展,一种基于毫米波三维成像的安检技术逐渐进入人们的视野,成为安检领域研究的热点。传统的近场毫米波三维成像算法在Nyquist
弧形阵列SAR(Synthetic Aperture Radar,简称SAR)是一种广域观测的新体制微波成像系统,将其应用于直升机平台上,能够实现对平台周围地形信息的全方位、短重访周期的成像感知。为了更充分地发挥弧形阵列雷达的潜力与效能,有必要对弧形阵列雷达的应用模式进行探索和研究。双基合成孔径雷达(Bistatic SAR,简称Bi-SAR)指的是收发分置的SAR系统,具有隐蔽性较好、抗干扰能力
随着社会经济的不断进步,人民生活水平逐渐提升,城市私家车保有量也在逐年稳步攀升。由机动车保有量上涨引发的交通需求与道路有限通行能力之间的不平衡关系日渐严重,最终以交通拥堵的形式呈现在我国的各个城市道路中。目前,交通拥堵问题在我国众多城市道路中日趋严重,频繁的拥堵不仅导致出行时间延误,而且加剧车辆污染排放。道路拥堵问题的治理关键是提前预测到可能出现的交通堵塞现象,并对各种拥堵情况发出预警信号,提前采
土壤与人类的生存和社会的可持续发展密切相关,土壤中所有的元素含量的参数都决定了植物的生命。土壤跟江河湖泊一样有一定的自我净化能力,但净化能力是相对而言的,超过了一定的限度,就很难恢复到原有的稳定状态,像土壤利用过度、盐渍化、化工污染等。本论文从土壤的盐分含量展开研究,土壤中盐分浓度过高会导致植物不能以正常的形态生长,破坏了它原本的生理参数和结构,不利于其生长和营养的吸收,从而影响区域的经济发展和生
Ti-6Al-4V(TC4)合金是钛合金家族用途非常广泛的一种材料,具有冲击韧性高、弹性模量低、耐腐蚀等优点。随着工业社会的不断发展,人们对材料构件的大小、形状有了更加精密、复杂的要求,传统的减材制造技术较难实现此目标,以激光选区熔化(Selective Laser Melting,SLM)为代表的增材制造技术完美地解决了这些难题。本文以激光选区熔化沉积态和退火态的TC4合金为研究对象,通过纳米压
葵花籽在种植、生产和保存过程中容易出现生芽、发热、霉变、发生虫害等。为了准确有效识别葵花籽霉变和虫蚀区域,提供霉变和虫蚀葵花籽识别的理论支持,研究基于机器视觉的葵花籽霉变和虫蚀识别方法,对提高葵花籽生产品质具有重要的实际意义。本文以霉变葵花籽和虫蚀葵花籽为研究对象,研究识别霉变和虫蚀葵花籽的方法。在巴彦淖尔市采取葵花籽,通过去除杂质(如土、叶子等)筛选出霉变和虫蚀葵花籽。使用智能手机对霉变和虫蚀葵