单样本离线手写体笔迹风格识别方法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:guodlleon
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着深度学习的发展,利用深度神经网络对手写体文字进行风格识别相较于传统的图像处理方法具有识别速度更快、准确率更高的优势。当前主流的离线手写体笔迹风格识别方法在针对中文、英文数据集时,需要基于段落、页面级的含有较多文字的图像进行风格识别,才能达到令人满意的效果。但是,在公安、刑侦和司法等领域中可用文字样本较少、内容差异巨大等应用场景时,当前方法识别效果非常不理想。面向实际中存在的这个问题,本文针对单样本离线手写体文字笔迹风格识别方法展开了深入研究。在已有网络模型的基础上,提出加入注意力机制和多任务学习算法对笔迹风格识别模型进行改进,模型显著提升了单样本笔迹风格的识别精度,论文主要工作如下:(1)提出了结合注意力机制的改进的GRRNN(Global-Context Residual Recurrent Neural Networks)网络模型GRRNNA(GRRNN with Attention)。GRRNN网络在应用于单样本笔迹风格识别时,由于样本所包含的信息有限并且其他特征会对笔迹风格特征产生干扰,导致不能提取出具有鉴别力的笔迹风格特征。针对这个问题,充分利用注意力机制能够从众多信息中选择出对当前目标任务更关键的信息的特点,提出了结合注意力机制的改进的GRRNN网络模型GRRNNA,使模型在学习过程中提取出对文字风格识别更重要的特征,减少对无关信息的关注度,从而提升模型对单样本离线手写体文字笔迹风格的识别精度。在HWDB1.0中文离线数据集上对模型进行评估的实验结果表明,GRRNNA模型在单文字上的识别率比GRRNN提高了1.41%,达到了94.10%。(2)提出了一种内容-风格信息解耦导向的单样本离线手写体笔迹风格识别多任务学习方法。在单样本文字风格识别中,输入的文字图像经过特征提取网络提取深度特征后,通过学习文字内容特征和风格特征的多任务学习,实现对离线手写体文字中内容信息和风格信息的分离,从而降低文字内容导致的图像特征干扰。同时,多任务学习能够提高模型的泛化能力,使网络模型对文字的风格特征具有更强的表征能力,进而提升模型对单样本文字的笔迹风格识别准确率。方法分别以Res Net-Block网络和VGG网络作为特征提取网络,构建基于多任务学习的离线手写体笔迹风格识别算法,在HWDB1.0中文离线数据集上的识别率分到达到了90.06%和95.25%,并且在Top5上的识别率分别达到了97.81%和99.67%,模型性能得到较大的提升。面向在线教育教学中的学生作业、测试等电子版作业提交存在抄袭等问题,将所提算法集成应用到学校建设的智慧教育平台中,构建了用于在线提交作业、课堂测试和课程考试等方面的抄袭行为AI验证功能模块,并进行了实际应用验证,收到了良好的效果,具有较大的推广和应用价值。
其他文献
大数据时代的到来,企业日益追求高效率、低成本的目标则需要集成化的系统来实现,网络的普及化也进一步凸显出信息系统(IS)对企业的重要性。IS被员工采纳使用后进一步的创新使用行为,体现出企业对IS投资的回报率大小。员工IS创新性使用作为IS采纳后使用行为的一种,不仅对系统价值的发掘和企业竞争优势的提高有利,而且对员工潜能的挖掘和个体绩效的提高也有利。由此,学术界对员工IS创新使用行为的影响因素展开了激
学位
月球作为地球唯一的天然卫星,将在以后的深空探索中发挥重要作用,有必要对其进行探索和开发。与地球表面通信环境相比,月面无线通信环境较差且缺乏必要的网络基础设施,而移动自组织网络(Mobile Ad Hoc Network,MANET)具有的无中心、自适应组网等特点,正适用于月面无线通信环境。本文研究内容基于月面自组织网络通信系统,包括以下三个研究目标:首先,设计并实现适应月面环境和业务特性的自组织网
学位
当前互联网技术和信息技术变革的迅猛发展,成为创业活动的有力推动力。根据GEM2019相关数据显示,机会型创业是近年来我国开展创业活动的主要动机。但不同于美国等国家,我国创业活动存在机会识别率高,机会开发利用率低的现实问题。因此,如何促进我国创业者成功开发利用创业机会具有重要的现实意义。此外,创业机会一直受到创业领域的重点关注,然而现有研究大都探索创业机会的识别问题而非创业机会的开发,且现有的研究虽
学位
科技创新政策是政府推进科技创新的重要手段,是提高社会经济发展与科技能力提升的重要手段,对科技创新活动具有规范与引导作用。科技创新政策决定了我国科技创新事业的发展与能力的提升,因此有必要对科技创新政策进行系统性分析。各省市在科技创新资源方面有着不同的优势与不足,因此各个省市在制定科技创新政策方面有一定的针对性。陕西省作为西北地区最重要的省份之一,其创新型省份建设的程度与创新机制体系建设的完善程度决定
学位
随着网络技术以及移动智能终端的稳定发展,我国现有网民规模逐年扩大,社交媒体的使用群体也日益壮大,这种媒介已经发展成为人们在工作、学习以及生活中不可或缺的重要组成部分。十四五规划明确提出我国要坚持创新在现代化建设全局中的核心地位,强化企业的创新主体地位,全面提升企业的技术创新能力,激发人才的创新活力。作为企业创新的主体—研发人员,其创新行为的产生与企业创新能力的提升紧密联系。本文将系统地探讨研发人员
学位
近年来,受到国际经济环境动荡的影响,我国已经进入了增速换挡的新常态经济发展阶段,创新驱动已经成为我国当前重要的经济发展方式。企业作为科技创新的核心经济主体,对创新的拉动作用不断增强。由于受到自身资源稀缺的限制,企业积极突破自身边界,挖掘外部供应链资源,将客户引入创新活动,提升企业整体的创新能力。本文从企业的重要外部利益相关者客户的角度出发,研究客户结构与企业双元创新的影响关系,探究市场地位的调节效
学位
当前,世界经济正处于复杂多变的经济形势之中,为应对知识经济时代下市场环境的高速变化,制造业企业面临着全新的挑战。伴随着制造业产业的整合程度越来越高,供应商这类供应链伙伴对企业创新产生的影响不容忽视。本文从供应商市场集中度、供应商产权集中度的视角出发,研究二者与企业创新投入之间的影响关系,并探究政府补贴与产权性质对其关系的调节效应,为企业创新投入水平的提升提供新的研究视角。因此,本研究对于企业整合供
学位
随着生活中数字化的趋势愈发明显,纸质文档的扫描、复印成了日常办公中必不可少的部分。与之相关具有扫描、复印等功能的多功能一体机,由于功能集成多样,需求日趋增加,应用领域也愈发广泛。但在复印打印等办公设备市场,占比份额较大的一直为日美韩等他国品牌。为打破垄断,掌握复印打印等核心技术,保障国家信息安全,复印机及相关设备的国产化正如火如荼的进行。在逐步追赶的过程中,面对以往产品的不足,需要不断研发迭代,以
学位
由于点云几何信息丰富,基于点云的语义分割算法受到越来越多的关注,并且在自动驾驶、计算机视觉和机器人等领域都得到广泛的应用。目前,点云语义分割算法主要以深度学习为基础,并且取得了一定的进步。然而,由于点云数据规模庞大以及网络模型设计复杂,网络的训练周期过长。同时,点云数据自身的无序性及无结构性等也使得网络对其局部几何信息的利用变得困难,导致分割精度有限。为此,本文对点云数据进行稀疏处理,提出对应的图
学位
脑疾病严重威胁着现代人的身体健康,医学影像技术可以提供大脑的结构和功能信息,对于各类脑疾病的诊断和研究都具有重大意义。本文的研究课题来源于与唐都医院神经外科联合研究的项目,包含脑肿瘤图像分割算法设计和药物成瘾患者在脑深部刺激下的脑电分析实验两个任务,主要研究内容和创新点如下:(1)提出了一种基于网络自调节策略的脑肿瘤分割算法。由于脑肿瘤中的水肿区域体素数量远远多于核心区域,不同肿瘤区域的体素数量极
学位