自然场景中文本检测与识别方法及其应用研究

来源 :延边大学 | 被引量 : 0次 | 上传用户:maoduoli
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
场景文本检测与识别技术是计算机视觉任务的分支,同样也是计算机视觉中的热点课题。该技术在卡证识别、无人驾驶导航、图像内容检索等方面具有广泛的应用前景。自然场景中的文本表现形式丰富多样,字符种类繁多,文本的大小、颜色、长宽比不同,并且有严重的背景干扰问题。如何从自然场景中快速准确地检测出文本区域并对其准确识别,仍是该领域亟待解决的问题。本学位论文通过深入研究分析场景文本检测与识别方法,对经典的文本检测算法和文本识别算法进行了较全面的改进,论文的主要研究内容如下:(1)针对自然场景中文本检测出现错检、漏检和实时性不足的问题,本学位论文改进了场景文本检测算法DBNet。首先,在主干网络Res Net中加入带有通道注意力和空间注意力的SA注意力机制;其次,采用带权重的双向特征融合机制代替FPN结构;最后,构建了多语种文本检测数据集,对模型进行预训练后微调,得到基于SA注意力机制和双向特征融合的场景文本检测模型。(2)针对自然场景下中文识别准确率低、对困难样本识别效果较差的问题,本学位论文改进了CRNN算法。首先,本学位论文采用Res Net替换其原有的VGG结构的7层卷积神经网络;其次,引入Focal CTC损失增加困难样本对总损失的贡献;最后,对中文场景文本数据集做数据增强,在此增强数据集上对模型进行训练,得到适合中文场景文本识别的模型。(3)提出了基于平均编辑距离的文本相似度匹配的阈值确定方法,结合本学位论文提出的的场景文本检测与识别模型,设计并开发了自然场景中牌匾定位系统。本文通过对比实验和消融实验验证了本学位论文所提出的方法的可行性和有效性,并对本学位论文开发的自然场景中牌匾定位系统进行了测试。实验结果表明,改进后的DBNet算法较比原算法在Icdar2015上的F值提升0.9%,并具有良好的实时性,在现实场景中表现更佳。改进后的CRNN算法在百度中文街景数据集中准确率显著提升,模型更加适用于中文场景文本识别。系统测试结果表明,本学位论文设计和开发的自然场景中牌匾定位系统可以实现对自然场景中的牌匾的检测、识别以及定位。
其他文献
CIB3属于CIB家族蛋白,该家族包括四个成员,CIB1、CIB2、CIB3、CIB4,除CIB4外其余三种蛋白均在内耳中有较高表达。其中关于CIB1研究较多,其参与有丝分裂、细胞凋亡、血管生成等过程。CIB2是一个重要的耳聋基因,在小鼠中敲除其同源基因会导致小鼠听力严重受损。而关于CIB3则尚无系统的功能研究。本文正是围绕CIB3在小鼠听觉和平衡觉中的生物学功能进行的初步探讨。我们首先利用CRI
学位
诱变育种是一种重要的农作物遗传改良技术,使用EMS诱变技术可获得大量大豆突变体,为研究大豆基因功能和分子育种提供良好遗传材料。株型与农作物产量密切相关,矮生大豆可用于提高种植密度。利用矮化突变体分离大豆株高调控基因,深入解析其调控的遗传规律和分子机制,可以为作物育种提供标记基因和参考。本论文利用甲基磺酸乙酯(EMS)诱变处理山东省高产优质品种“菏豆12号”(Hedou 12,H12),获得矮化突变
学位
目的 分析武义县农村女性宫颈癌筛查情况及影响因素。方法 回顾性分析2017—2021年参加农村两癌筛查的68 799例妇女的筛查资料,采用单因素和多因素logistic回归分析武义县农村女性宫颈癌的影响因素。结果68 799例筛查对象中,高危型人类乳头瘤病毒(human papilloma virus,HPV)阳性者8 900例,占12.94%。接受阴道镜检查结果异常者861例,占比1.25%;宫
期刊
目前,我国正处于进入经济结构转型升级时期,实施制造业与服务业的“双轮驱动”战略已成为产业结构转型升级的必经之路,而高技术产业和生产性服务业作为经济的新增长点,是实施创新驱动的重要支撑产业和产业结构优化的动力源。产业关联性强、带动作用显著的生产性服务业为高技术产业提供多方面服务,提高产业分工协作效率,促使高技术产业向高端价值链转移,反过来,知识技术密集、创新性的高技术产业要求生产性服务业更专业化。两
学位
随着夜经济的不断发展,景观照明通过灯光与环境的高度结合正在逐渐满足人们对于感官和视觉的需求,夜间旅游也正逐渐演变为一种新型游览方式,而这也促进了众多景观照明企业的兴起和发展。但是由于近年来,国内国际的复杂环境导致经济压力不断增加,给众多中小型景观照明企业带来了巨大的挑战,景观照明企业要想在政策改变下脱颖而出,就需要及时改变企业的发展战略,积极应对发展趋势和竞争环境的改变。上海XL光电公司就是一家专
学位
1998年,全国区域内全面开展职工医疗保险制度改革。Y市于2000年设立了医疗保险经办服务中心,并开始实行城镇职工医疗保险制度。由于城镇职工医疗保险属于基本社会保障体制的主要部分之一,因此医疗保险基金的风险管理直接关乎着整个国家基本医疗保障体制的顺利运行,以及各行各业工作人员及居民百姓的切身利益。随着医保惠民政策的不断深入,我国人口老龄化程度的不断加剧、医疗待遇支出逐年增长等因素,强化医疗保险基金
学位
我国生猪一年消费量为5—6亿头,占所有肉类消费量的80%,随着我国居民对肉类产品的需求量与日俱增,生猪产业发展对缓解需求有积极作用,同时能稳定民生水平。由于散养户退出明显,使得我国生猪养殖规模化程度有所提高,未来规模化养殖会成为主要趋势,随着规模化提高、生产成本增加、耕地资源稀缺、居民肉产品需求增加,机会成本增加和环保鉴证等因素影响,等现象的表现,对我国生猪生产布局优化提出了更高的要求,因此优化生
学位
LOXL3属赖氨酰氧化酶(Lysyl oxidase,LOX)家族成员之一,该家族共有LOX,LOXL(1-4)五个成员,每个成员都有高度保守的C端序列以及变化的N端。主要功能是催化氧化胶原蛋白和弹性蛋白发生交联并组成细胞外基质主要成分,除此之外,变化的N端序列可能也赋予他们独特的新的生物学功能。有研究表明LOXL3基因的错义突变会导致常染色体隐性遗传病Stickler综合征家族中两兄妹患病,并且
学位
土壤酸化是全球范围内限制作物生长的主要因素之一。其中,铝(Al)作为酸性土壤限制作物生长的一个最主要因素主要表现为抑制根系的生长。植物在长期驯化过程中演绎出不同的耐铝毒机制,主要包括外部排斥和内部耐受机制,其中前者占据主导。研究表明,拟南芥中ALMT1介导的根系苹果酸分泌在植物耐铝调控中起到关键作用。一些参与ALMT1上游调控的转录因子例如STOP1、CAMTA2和WRKY46等具有重要作用。此外
学位
诱变育种是农作物遗传改良的重要方式之一,本实验室前期建立了大豆EMS诱变突变体库,获得了大量的用于重要功能基因挖掘和分子育种的突变体。在突变体库中筛选得到一个黄化弱小的突变体Gmyld1。前期已经对Gmyld1进行了遗传分析,确定它们是单基因控制的隐性纯合突变,并初步定位了该突变位点。在此基础上,对Gmyld1进行突变基因精细定位、等位系构建、基因功能鉴定研究及RNA-seq分析,为进一步揭示该基
学位