基于神经网络的维吾尔语图像文本检测与识别技术

来源 :新疆大学 | 被引量 : 0次 | 上传用户:zhangway77
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着计算机技术以及便携式移动设备的迅速发展,包含丰富精确文本信息的图像和视频数量急剧增加,而快速准确地检测和识别出这些文本信息在多媒体检索、机器人导航、人机交互和工业自动化等领域具有广阔的应用前景,因而在学术界和工业界受到了越来越多的关注。而图像文本的字体多变、种类多样、背景复杂,因此图像文本的检测与识别问题仍然未能得到彻底的解决。因此,本文对图像文本的检测和识别方法进行了研宄,主要的工作如下:一、针对维吾尔语图像文本的特点,本文提出了基于通道增强最大稳定极值区域(MSER)和卷积神经网络(CNN)的文本检测方法。为了获取更完整的候选区域,分别对R、G、B三个单通道图像进行通道增强,使得图像文本的附加部分加入到主体部分形成连通域,在每个通道提取MSER区域,合并三个单通道下提取的区域作为文本候选区域。为了快速有效地去除非文本区域,本文参考Le Net-5设计了一个CNN分类网络,充分利用了CNN网络自动获取描述特征的方式,避免了繁琐低效的人工特征提取工作。在测试数据集上本文图像文本检测方法的准确率、召回率和F-值分别达到了0.881、0.872、0.876,实验结果表明本文算法具有一定的鲁棒性和应用性。二、对卷积循环神经网络(CRNN)模型进行了改进,然后用改进的CRNN网络模型对维吾尔语单词图像进行了文本序列识别。本文将数据集中的维吾尔语单词图像用拉丁文形式标注,然后将转录层的解码结果转换成拉丁文字符,最后把拉丁文字符转化成维吾尔语文本序列。改进CRNN网络模型的识别算法在随机合成图像数据集和任意长度图像数据集上的准确率和AED分别为0.864、0.204和0.780、0.492,同时识别结果优于原CRNN网络模型和目前比较流行的Tesseract-OCR识别工具。三、为了满足图像文本的检测与识别任务所需要的样本数据,本文首先收集了各种类型的图像并对其进行了分类、整理以及划分,建立了图像文本检测数据集,该数据集包含386张彩色图像和16683张裁剪图像。为了满足改进CRNN网络模型的训练与测试,自主研发了一个随机单词图像制作工具,建立了一个用于模型训练与测试的随机单词图像数据集,该数据集包含一百多万张大小固定的单词图像,同时建立了一个用于验证模型性能的任意长度单词图像数据集,该数据集包含十万多张任意大小的单词图像。通过上述的研究,本文对图像文本的检测与识别技术都进行了研究,并为图像文本的检测与识别问题做出了贡献。
其他文献
本篇论文研究的是半动力系统的路径算子的相关性质。马氏过程的可加泛函是马氏过程理论的重要组成部分。而半动力系统的可加泛函是研究逐段决定马氏过程可加泛函的分析基础。
人脸相关问题是计算机视觉领域一项重要且富有挑战性的研究课题。几十年来,已经引起诸多研究者的持续关注和探索。然而,目前大多研究只适用于非约束环境,人脸呈现出的光照、
芒草作为目前最具开发潜力的高产纤维素能源植物之一,由于其具有生物量大、纤维素含量高、灰分低、热值高、适应能力强以及生产成本低等诸多优点,在我国应用广泛。研究芒草热解焦的气化特性不仅可以为提升能源草气化产物成分及产量,提高其气化效率等提供理论依据,而且可以为制造能源草气化设备提供技术指导。以N2气氛下不同制备温度下得到的芒草热解焦为研究对象,采用元素分析及工业分析、红外分析(FTIR)、X射线衍射(
无人驾驶汽车是一种具有自主决策能力,同时具备自适应和学习能力的智能交通设备。目前,自动驾驶技术在人工智能和汽车行业的飞速发展下逐渐成为业界焦点,除了传统汽车公司,各大科技巨头、技术型公司也纷纷进入自动驾驶领域,一旦技术成熟,自动驾驶将大大减少交通压力、交通排放和交通事故,给人们的生活带来极大的便利。自动驾驶领域中一个主要的研究方向是环境感知技术,若汽车对周围环境没有正确的认识,会导致自动驾驶汽车的
近年来,基于暂态分量的超高速保护方法蓬勃发展,其中波形唯一暂态保护原理以其综合时域和频域的的特征信息,受故障条件影响小等优点成为研究热点。但利用波形唯一原理综合时频特征信息进行输电线路故障保护时,需将故障波形逐个与样本库波形进行匹配,计算繁琐,所需时间较长,大大影响了保护的速动性。为促进基于波形唯一性暂态保护原理的实用化,论文提出了一种结合经验模态分解(empirical mode decompo
贫困属于世界性难题之一,不仅是世界各国政府在国家治理中的关键所在,同时也被党中央和国务院列为需要重点加以解决的问题。一些专家和学者提出,金融扶贫或将成为治疗贫困顽疾的良方。包括我国在内,世界上很多国家已经在金融扶贫领域取得了一定的成果。以国务院成立扶贫开发领导小组为标志,我国的扶贫工作已有30多年的历程,金融扶贫也经过了一定时间的发展。由于金融扶贫政策效果不佳、农村金融市场不够完善等问题,金融扶贫
随着人们生活水平提高和饮食观念改变,对生鲜果蔬等冷链品的品质和需求与日俱增,这推动了冷链物流的发展。现阶段我国冷链物流发展水平较为落后,配送成本高、产品损耗大等问题严重制约冷链物流发展。冷链配送作为冷链物流运作中的重要环节,如何科学合理地选择冷链物流配送路线至关重要。本文以云冷Y号为背景,研究了多温共配路径优化问题,主要从以下方面展开研究。首先根据冷链物流的理论基础描述云冷Y号的冷链物流运营模式、
1960年Astrov最先发现单相磁电材料为Cr2O3,然后人们陆续在Ti2O3、GaFeO3、磷酸盐化合物以及一些方硼石中发现了磁电效应。但是经过深入研究,单相磁电材料在室温磁电转换系数
我国冬季南北气温相差很大,受到冻融作用地区的最冷月平均最低气温从-30℃以下到0℃以下不等。但是目前我国主要的冻融试验规范均采用冻结温度为-18±2℃进行试验,其试验结果直接用于不同地区混凝土结构的冻融耐久性设计和冻融耐久性寿命预测的适用性和准确性有待商榷。因此,本文围绕冻结温度对混凝土冻融损伤程度的影响这一主题,采用快冻法,以质量损失率、动弹性模量损失率、劈拉强度损失率、超声波速损失率、氯离子扩
中世纪哲学越来越受到人们重视,基督教神学家是当时哲学领域研究的主要成员,他们努力将基督教教义同古希腊哲学、古罗马哲学相互借鉴融合,形成全新的解释。在众多中世纪优秀的哲学家当中,阿奎那作为百科全书式的人物,不仅是“天使博士”、而且对于古希腊和罗马时期的伦理学都有着十分独到的看法和研究。阿奎那的节制美德思想有着浓厚的神学渊源,也有着对哲学的追问。本文从古希腊哲学家柏拉图、亚里士多德;古罗马时期的《神名