【摘 要】
:
随着全球信息化的到来,电子设备逐渐智能化,使用电子产品进行社交娱乐等活动已经成为大众生活中不可或缺的一部分。目前,中英文的文字识别技术已趋于成熟,但藏语由于受众较小,研究人员也较少,以藏文为基础的信息化处理技术则相对滞后。随着针对藏族文字手写输入和文本识别功能的设备越来越多,藏文的手写输入迫切需要更高效的识别技术。因此,手写藏文识别技术的研究不仅具有社会价值,还有更为广阔的市场价值。本文在深入分析
论文部分内容阅读
随着全球信息化的到来,电子设备逐渐智能化,使用电子产品进行社交娱乐等活动已经成为大众生活中不可或缺的一部分。目前,中英文的文字识别技术已趋于成熟,但藏语由于受众较小,研究人员也较少,以藏文为基础的信息化处理技术则相对滞后。随着针对藏族文字手写输入和文本识别功能的设备越来越多,藏文的手写输入迫切需要更高效的识别技术。因此,手写藏文识别技术的研究不仅具有社会价值,还有更为广阔的市场价值。本文在深入分析手写体藏文字丁的识别难点和文字技术发展的基础上,重点研究了藏文文字的结构特点和神经网络在少数民族文字上的应用。由于藏文字丁具有书写独立、符合国家编码标准等优点,本文选择以手写藏文字丁为基本识别单位,主要工作如下:(1)本文在实验室自建手写体藏文字丁数据库的基础上,通过手写体字丁采集软件对数据进行采集,最终采集到20套,每套663个,共13260个手写藏文字丁样本。(2)本文研究了基于特征提取的手写体藏文字丁识别技术,主要包括图像预处理、特征提取、分类识别三大模块。并提出了一种将文字特征进行二次融合的特征提取算法。实验表明,经过二次融合后的特征向量在分类识别任务中表现良好,前十识别率为96.11%。(3)本文首次将CRNN网络模型应用到手写体藏文字丁的识别任务中,并通过仿真结果验证了该方法在手写体藏文字丁识别中的有效性和可行性。另外,本文针对手写藏文字丁的文字结构特点,提出了一种基于CRNN和自注意力机制的手写藏文识别方法。实验结果表明,在有限的训练样本集中,本文提出的改进模型对于手写体藏文字丁识别准确率稳定在92%。(4)针对相似元音导致的手写藏文字丁的错误识别问题,本文提出了一种基于元音分类的识别算法。通过将联机信息与网络模型进行有机结合,可以有效提升元音识别准确率。本文提出的网络模型较小,具备可移植性,能更好的应用到实际场景中。
其他文献
随着人工智能的迅速发展,深度学习在医学领域的应用越来越广泛,甚至改变了部分研究的发展局面,在此背景下,国家提出推进中医现代化、信息化、智能化的目标。虽然目前已有一些人工智能和中医结合的应用研究,但对中医智能处方模型的研究非常少,仅有的一项研究最终效果不理想。然而智能处方模型研究是中医智能化目标中非常重要的任务,因此,本研究针对中医智能处方模型的构建、多种处方模型的效果比较、模型语义特征提取及中医古
在游戏产业蓬勃发展的大背景下,受研发成本、捞金思维、流量焦虑三种因素影响,游戏营销乱象横生。同时,依靠众多合作伙伴构建生态系统、共同进行价值创造正在成为企业发展的主流趋势。论文第一次将价值共创理论引入游戏品牌营销领域,在媒介融合与智能传媒的大背景下对游戏品牌价值共创的一般模式展开深入研究,并根据研究发现对游戏品牌营销实践提出针对性建议。论文首先对品牌价值、价值共创、游戏营销三个领域国内外研究现状进
类不平衡数据处理已成为机器学习与数据挖掘领域的研究热点与难点之一。特征选择是解决不平衡数据维度问题的常用手段,目的是尽可能地保留与少数类相关的特征以提高分类精度。不平衡数据结构的复杂性给后续的特征选择和分类带来了极大的困难,因此,研究类不平衡数据的特征选择以提高分类准确性是非常必要的。过滤法是特征选择最简单且常用的方法之一,使用单一的过滤法进行特征选择往往会使重要特征被遗漏。本文采用十种不同的过滤
无线自组织网络是一种自治、多跳的临时性网络,与传统的有线网络相比,能够在不依赖固定网络基础设施的情况下,快速地为军事和民事应用搭建网络平台,是移动通信网络的重要组成部分。相对有线链路,无线链路具有误码率高、带宽受限等特点,导致节点间的通信可靠性差、端到端时延高、吞吐量小。传统的多路径路由协议解决了数据分组的可靠传输问题,同时通过多路径并发传输技术提升了网络吞吐量,但并没有考虑针对不同的业务需求提供
随着科学技术的发展,越来越多的新型材料被开发出来,并且在人们的生活中起着越来越重要的作用。同时,为了节能环保,将已有资源重复利用或者提高利用率也是科研人员值得关注的问题。煤焦油中的富集产物芘具有独特的荧光性质,并且π电子离域能较强,还可以通过特殊的方法修饰其各个位置使其具有不同的性质,因此在有机光电材料,分子荧光探针,细胞成像等领域有着广泛的应用。本文通过特殊的方法,将羟基修饰在芘的非活性位置,并
当前,我国农民专业合作社正处于数量增长迈向质量提升的关键期,但大多数农民专业合作社存在总体发展质量不高,管理运行不够规范,对成员带动不够,成员合作意愿普遍不强等问题
轴手性作为一类特殊的手性骨架一直以来得到了广泛的关注,经过多年发展成为不对称领域中一颗闪亮的明珠。手性磷酸作为有机小分子催化中的翘楚,在近二十年里实现了诸多手性化合物的催化不对称合成。本文报道了利用Friedl?nder反应催化不对称合成轴手性芳基喹啉类化合物的研究。喹啉骨架在有机合成领域占有举足轻重的地位,广泛存在于天然产物、药物活性分子、配体及催化剂中。经典的Friedl?nder反应一直是构
随着当今社会计算机技术的发展,各类软件的代码规模不断增加,代码中所存在的问题排查难度越来越大,因此自动化软件测试逐渐受到了人们的重视。抽象语法树这一数据结构作为软件测试中代码信息的来源,其正确性与完整性对于软件测试的最终结果有着决定性的作用。传统的抽象语法树生成技术大都依赖于开发人员所提供的语法范式,且这些抽象语法树生成技术主要是进行较为简单的词法和语法分析,对于复杂程度较高的语法会出现分析失败的
二氧化氮(NO_2)是一种刺激性气体,会引起呼吸道感染,光化学烟雾和酸雨,对环境和人体极为有害。因此,开发一种高灵敏度、选择性好、响应快、检测限低并能在室温条件下进行检测的传感器是非常重要的。聚吡咯由于其优良的导电特性、易合成、易附在柔性薄膜上等优点,引起了人们的关注。但是,纯相聚吡咯气体传感器有很多缺点,主要为:气体传感器对气体的灵敏度、选择性和检测限不理想。为了提升其传感器性能,对聚吡咯进行掺
本论文以扫描隧道显微镜(STM)为主要研究工具,在高定向热解石墨(HOPG)的表面上,研究了一系列C_3型对称性羧酸分子在表面主客体化学中的自组装结构,并借助密度泛函理论(DFT)总结其中规律及特性,主要研究内容如下:(1)通过STM研究了,查尔酮二羧酸配体(H_2L)分子在不同溶剂中的自组装结构,发现H_2L分子在不同溶剂中会形成不同的自组装结构并对其形成机制进行探究;通过苯三氧十一酸(TCDB