基于深度学习的场景文本检测技术研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:dyoyo90
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为信息传递的中间介质,图片占据着举足轻重的位置。而对图片中的文字内容进行检测以及识别,则有助于加速图片在人们之间的传播,使信息传递更加高效便捷。在计算机视觉领域,自然场景文本检测可以说是一个热门且具有挑战性的问题。在很多情况下,图片本身所包含的文本信息是理解该图片场景内容的重要因素,因此对于自然场景文本检测的越准,我们对图片所包含语义的理解也就越准。目前来看,之前研究人员所提出的CTPN网络存在一些不足之处,例如文本检测精度不高,以及只能检测水平方向的场景文本。本文基于对CTPN的深入研究与改进,提出了新的场景文本检测网络。论文的主要研究内容及成果如下:1.基于ResNet具有较强特征提取能力的特性,本文使用ResNet代替原网络中的VGG16来提取更深层次的图片特征,使得所提取图片特征的语义性更强。在此基础之上,本文还使用了多层网络特征融合技术,使得提取到的图片特征更加丰富。2.在一些基于深度学习的网络模型之中,attention注意力机制常用于和RNN网络相结合,从而对上下文序列进行更加合理的权重分配。本文在双向LSTM之后引入了 attention机制,用于更好地学习各个文本检测框之间的上下文联系,从而得到更加准确的场景文本检测结果。3.由于网络模型本身的限制,原CTPN网络只能将检测得到的各种尺寸文本检测框在水平方向上连接起来,本文通过使用最小二乘法对原有网络的文本行构造法进行改进,从而能够将场景文本检测的方向由水平拓展为倾斜。本文的主要内容是对原有CTPN网络的优化与改进,包括:特征提取网络的升级、多层网络特征融合的使用、attention机制的应用以及将CTPN的场景文本检测方向由水平拓展为倾斜。文中的多组对比实验表明改进后的网络在整体性能上强于原有的CTPN。
其他文献
学位
学位
农业用水是我国用水大户,也是节水潜力所在。由于地区地处季风,我国水资源分配在时间和空间上分布极为不均匀,造成了我国水资源短缺的现状。另一方面,我国存在水资源严重浪费的问题,灌溉技术落后导致农业用水效率低,农业用水无法精准计量,难以激发农户的节水意识和节水管理,水费实收率也远远低于应收取的费用,灌区农田水利工程难以运行维护,无法提高灌溉水利用系数,从而导致恶性循环。水资源的短缺与水资源浪费是造成水资
镁合金作为迄今为止工程应用中最轻的结构材料,逐渐被应用于各行各业。AZ80A镁合金塑性好,强度高,性能优良,价格相对便宜,工业应用前景广泛,越来越受到国内外学者的青睐。本文采用光学显微镜(OM)、X射线衍射仪(XRD)、扫描电子显微镜(SEM)、能谱仪(EDS)等研究了铸态AZ80A镁合金均匀化热处理前后的微观组织和元素分布;分析了均匀化温度和保温时间对铸态AZ80A镁合金微观组织的影响;采用电子
镁合金具有良好的轻量性,切削性,耐蚀性,减震性,尺寸稳定和耐冲击性。在计算机类、消费类电子产品、高铁、航空航天等领域应用前景好、潜力大。镁合金的晶体结构是典型的密排六方晶体,滑移系较少,晶粒不易产生宏观屈服而易在晶界产生大的应力集中。在宏观上表现为塑性变形能力差,在微观尺度上由于生产或加工过程中引起的微缺陷(缩孔,微裂纹)的存在,它与实际金属的扩散、断裂主要塑性形变有着密切的关系,并且强裂地影响着
随着社会经济的发展,人们对汽车舒适性的要求越来越高,而车内低频噪声是影响乘车舒适性的重要因素之一。传统降噪手段主要是针对中高频噪声进行隔声、吸声,而对低频噪声降噪
随着人类航天任务的不断开展,失效/退役航天器逐年增加,空间碎片的数量也在与日俱增,使得空间运行轨道变得愈发拥挤,轨道上其它服役航天器的运行安全风险也越来越高,因此面向失效/退役航天器回收、太空碎片清除等任务的需求日益迫切。从安全、能耗及工作效率等多角度出发,利用空间机械臂替代宇航员执行空间操作任务是当前太空探测的发展趋势。而在利用空间机械臂执行前述接触型操作任务时,机械臂末端将与目标载荷发生接触碰
学位
现今,土壤重金属污染已经成为一种严重的土壤污染问题。土壤中含有过量的重金属镉,会对植物正常生长产生影响。桑树对恶劣的土壤和环境条件具有较高的耐受性,已证明使用桑树改善环境能够减少环境治理的成本。本论文分析了桑树在重金属镉的胁迫下的生理生化指标、转录组、miRNA差异,并对响应镉胁迫的基因进行了克隆及功能鉴定。研究结果有助于进一步阐述植物高效耐镉的分子机理以及为培育高耐镉新品种提供一定的理论依据。主
学位