基于深度学习的维吾尔文检测识别研究与设计

来源 :成都理工大学 | 被引量 : 1次 | 上传用户:kms2006
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展,海量的图片信息充满了人们生活的方方面面,利用计算机自动有效地识别图片中的文本内容对于提高多媒体检索能力、场景理解能力以及网络信息平台管控效率等具有重要意义。目前,关于自然场景下的中英文检测与识别方法已有很多,而对于维吾尔文的检测与识别尚处于探索阶段,还没有相对完善的理论方法。本文基于深度学习技术,对自然场景图像中的维吾尔文检测与识别进行研究,以实现一种高效的维吾尔文识别系统,主要研究内容如下。1.研究了Synth Text自然场景文本图像合成方法,人工生成了一个维吾尔文图像数据集,有效解决维吾尔文检测实现过程中训练样本稀缺的问题。该方法根据原始背景图像的分割信息与深度信息筛选出合适的文本嵌入区域,将文本目标自然嵌入到背景图像中,人工合成类似自然场景下的文本图像。但由该方法合成的文本图像存在丢失维吾尔文连写特征的缺陷,针对该问题,使用PIL图像处理库绘制了一批具备连写特征的维吾尔文图像作为合成数据集的补充。2.研究了CTPN和EAST两种文本检测算法,并分别使用这两种算法进行了维吾尔文检测实验。实验结果显示,CTPN能较完整地检测较长的维吾尔文,但对倾斜文本的检测效果较差;EAST能检测任意角度的文本,并且检测速度较快,但在检测较长的维吾尔文时出现检测不完全甚至丢失的情况较多。此外,CTPN在测试集上的F-measure高于EAST,并且能更好地检测维吾尔文字符周围的点,最终选用CTPN模型作为维吾尔文检测的基础模型。3.研究了基于attention机制和基于CTC损失函数的两种主流文本识别框架,选用CRNN+CTC的文本识别方案进行维吾尔文识别。由于维吾尔文字符具有自右向左的书写特点,而CRNN网络对图像的特征提取顺序为自左向右,造成CTC输出的维吾尔文序列与正确的标签序列顺序相反,导致训练错误的模型。为此,本文对CTC的输出部分进行了改进,设计了符合维吾尔文书写顺序的字符排序规则,使网络输出正确书写顺序的维吾尔文序列,从而正确训练模型,实现对维吾尔文的识别。数据集为使用PIL图像处理库人工生成的800万张尺寸为280?32的维吾尔文识别图像。实验结果显示本文训练得到的CRNN_CTC模型在测试集上的维吾尔文识别准确率为64%。经过上述研究,本文设计并实现了一种基于深度学习的维吾尔文识别系统。该系统主要包括:图像预处理模块、维吾尔文检测模块、文本图像倾斜校正模块和维吾尔文识别模块共四个模块。其中,维吾尔文检测模块和识别模块分别由CTPN模型和CRNN_CTC模型实现。对该维吾尔文识别系统进行了实验测试,在单个NVIDIA GTX 1080Ti GPU上同时运行4个进程时,每个进程的单张图像平均识别耗时为0.663s。
其他文献
随着现代传媒技术的迅猛更新,电视作为传统传媒企业正在不断遭受冲击,数据显示,2014年以来对中国电视播出与收视市场份额解析表明,播收份额齐跌,多个地方台连续出现收视率负
金属-有机框架由于其特殊的物理、化学性质而被应用于吸波材料研究方面,继而以金属离子及有机配体作为前驱体的复合材料也被证实具有良好的吸波性能。现有的金属-有机配体大多具有良好的磁损耗能力,为了增强材料吸收电磁波的能力,多使其与具有优秀介电损耗能力的介电材料相结合。基于此,本文以水热法合成金属-有机框架作为前驱体,在此基础之上与氧化石墨烯复合来制备较高性能的吸波材料。主要研究内容如下:(1)合成以钴离
随着互联网技术的快速发展,网络文本数量呈现爆炸式增长。这些网络文本对电商、政府部门和潜在用户而言具有重要的参考价值。一方面,只分析文本的整体情感倾向已经无法满足这些群体的需求,需要更细粒度的分析;另一方面,反语和讽刺内容的存在,会翻转句子的情感极性,导致误判,极大地影响了情感分析的准确性。因此,对网络文本进行细粒度情感分析和反讽检测具有重要意义。现有方法通常把细粒度情感分析视为文本分类任务,用LS
断层在油气藏的形成过程中起到促进有机质演化、提供油气聚集储集场所、改善储集性能、运移油气、连接圈闭等作用,研究断层的产生与发育机制对于油气藏资源的开发利用具有重要意义。目前已经证实断层在形成的过程中会引发构造地震,而地震是否会引发新的断层、褶皱等岩石破裂的产生及其形变机制的问题仍有待探究。2008年的“512”汶川特大地震,是印度洋板块向亚欧板块俯冲,造成青藏高原快速隆升的结果,有关研究发现其引发
我国自分税制财政体制改革后,整体经济发展水平提高,财政收入规模迅速壮大,同时地方政府税收收入和非税收入均保持增长态势,但是财政收入结构逐渐呈现出不合理变化趋势。市场经济国家中,税收是政府财政收入的主要来源,我国从中央政府到市县级政府,税收均占据主要地位,故在税收飞速增长超过了GDP增速时产生了“税收超经济增长”的热议,而在此之后,地方政府的非税收入扩张成为了新时代下的又一聚焦点。“财政是国家治理的
家庭农场的纵向协作问题不仅关系到我国家庭农场未来的发展前景和方向,也关系到我国农业产业化和现代化的前景和方向。推动家庭农场与其他农业经营主体的紧密协作,有利于充分发挥各个经营组织的制度优势,实现资源共享、功能互补与合作共赢,推动各个农业经营主体间利益共同体的建立,加快我国农业产业化和现代化的发展进程。以家庭农场为研究对象,探索家庭农场的纵向协作模式问题具有重大的理论价值和现实意义。本研究的主要内容
卡麦花岗岩体位于藏东贡觉县内,大地构造位置属于羌塘—三江造山系(一级构造单元),江达—绿春火山—岩浆弧(二级构造单元),江达—维西陆缘弧(三级构造单元),卡麦花岗岩体出露于江达—维西陆缘弧中北部,研究区所处的陆缘火山弧系金沙江洋盆向西俯冲作用的产物,区内构造作用强烈,并伴随发生过大规模岩浆作用。本文以藏东贡觉县卡麦花岗岩作为研究对象,通过野外实地勘察,了解岩体实际空间展布情况并结合镜下特征了解岩体
受成因及演化过程的影响,堆积体的结构不均匀性是一种常见的沉积现象。因局部粗颗粒、巨颗粒富集导致的不均匀性是其中一种常见的形式。由此引起的降雨过程中的差异入渗可能是导致地表水体能够快速侵入堆积深部进而诱发堆积体产生深层失稳破坏的重要原因。本文通过对土门河两岸的滑坡堆积体进行实地调查,详细阐明了该地区堆积体的物质组成、结构特征和沉积特征。在此基础上,概括总结出三种典型局部粗颗粒、巨颗粒富集模式,采用室
当前,中国经济进入高质量发展阶段。民营企业作为增加财税收入、推动科技创新、实现高质量发展的重要主体,需要更加自觉地遵循新发展理念,转型升级、创新发展、全面践行社会责任。“营商环境就是生产力”。然而部分地区对营商环境重视不够,优化营商环境的政策落地难、企业获得感弱,民营企业面临的“卷帘门”“玻璃门”“旋转门”现象依然存在,严重影响了民营企业的高质量发展和履责积极性。在此背景下,本文研究营商环境与企业
为了满足乡村振兴背景下农村经济体制改革的要求,缓解家庭联产承包责任制导致的土地细碎化等问题,需要通过土地流转来实现土地适度规模化经营的目标。入股作为土地流转中较为新颖的方式,可以有效促进土地的适度规模化经营,因而受到农业经济学、法学等领域学者的关注。近些年“三权分置”政策的出台为实现土地流转和利用指明了新的方向,各地区纷纷开展试点积极为农村土地经营权入股有限公司提供实践经验,此次《农村土地承包法》