【摘 要】
:
随着我国社会智能化进程的不断推进,人工智能被应用到越来越多的领域和应用场景,同时由于自动化识别需求的提升,手写汉字图像的自动化识别成为了当下计算机视觉领域的研究聚焦点。本论文针对手写汉字由于字符疏密不同和连笔交叠导致的检测定位困难问题,完成了基于深度学习的离线手写汉字检测算法的构建;同时由于汉字数量过于庞大,且手写字形复杂多变导致的识别分类困难问题,完成了基于深度学习的离线手写汉字识别算法的构建;
论文部分内容阅读
随着我国社会智能化进程的不断推进,人工智能被应用到越来越多的领域和应用场景,同时由于自动化识别需求的提升,手写汉字图像的自动化识别成为了当下计算机视觉领域的研究聚焦点。本论文针对手写汉字由于字符疏密不同和连笔交叠导致的检测定位困难问题,完成了基于深度学习的离线手写汉字检测算法的构建;同时由于汉字数量过于庞大,且手写字形复杂多变导致的识别分类困难问题,完成了基于深度学习的离线手写汉字识别算法的构建;最后搭建了基于上述两个模块级联的离线手写汉字识别系统,实现了手写汉字图像的自动化识别。主要研究内容如下:(1)离线手写汉字检测算法:本论文首先阐述了传统手写汉字分割方法的不足,分析了基于深度学习的SSD算法的优劣。针对汉字字符间的连笔、不规则排列等情况,结合手写汉字图形的特性,通过重构特征提取网络、增强特征融合、优化预选框、优化损失函数四方面对SSD算法模型进行优化改进,并在自主构建的手写汉字检测数据集上进行网络训练和测试。实验结果表明,优化网络的m AP相比SSD网络的m AP,提升了6.04%。(2)离线手写汉字识别算法:本论文根据汉字的书写笔画、字形结构等属性构建了书写等级规范,并对HCL2000数据集和CASIA-HWDB1.1数据集进行了分析、解码以及汉字书写等级评定。为了解决手写汉字字形复杂多变和汉字数量过于庞大导致的识别难度大、网络臃肿问题,以识别分类精度和网络量级为双抓手进行优化。由于手写汉字书写自由度差异过大,因此本论文建立了汉字书写规范等级标准,针对不同书写等级(Ⅱ级、Ⅲ级)的离线手写汉字,分别构建了融合Gabor的离线手写汉字识别网络和基于残差结构、分组卷积和通道重排的离线手写汉字识别网络,并在对应数据集上分别进行两个优化网络的训练和测试。两组实验结果表明,相较于VGG16基础网络,优化后网络均在保持或提升TOP-1分类识别精度的情况下,实现了模型轻量化的优化目标。(3)针对离线手写汉字识别系统部分:本论文搭建了基于Kivy的离线手写汉字识别系统,完成了从底层数据到高层应用的打通,通过离线手写汉字检测和离线手写汉字识别两个模块的功能级联,实现了离线手写汉字图像的自动化识别。
其他文献
随着互联网技术的高速进步,传统工业领域应用互联网技术的情况越来越普遍。工业系统中数据的重要性不言而喻,而传统行业中的企业在数据管理方面能力的欠缺以及数据管理工具的缺失,加之数据来源多样化且异构性高,导致大量工业数据或是质量不高、或是同一企业分布在不同业务系统中的数据之间形成信息孤岛等等,使得数据中的信息得不到有效利用,这其中蕴藏的大量宝贵财富被浪费。针对上述场景,如何高效地集成及清洗多源异构数据,
推荐技术可以发掘用户感兴趣的商品,已经被应用到了互联网的各个领域。一般的推荐系统,通常基于用户的完整个人信息和历史行为做出推荐决策。但在某些情况下,用户的登录和访问是匿名的,其个人信息和长期配置文件往往不能直接获取,并且用户的兴趣又是动态变化的,具有较强的即时性,因此,需要考虑基于用户当前正在进行的会话(Session,又称匿名会话)做出推荐决策,即会话推荐(Session-based Recom
同步理论的起源来自于17世纪C.Huygens发现的单摆同步现象,在这之后的数百年里,同步现象被大量的学者发展和完善,并在众多领域中展现了其应用价值。近些年来,研究人员在微观尺度下观察到了类似的同步现象。依托量子力学的独特性质,使经典同步理论很难准确的描述和分析量子系统的同步现象。所以,量子同步理论成为了一个新的研究热点。量子同步理论作为量子力学、信息学与控制论的交叉学科,其主要研究目标使给出量子
建立可以与人类进行自然交流的智能聊天机器人一直是人工智能领域的巨大挑战。特别是开放域对话系统长期受到语料库和建模方法的限制,难以实现没有任何场景及话题约束的自由聊天。随着深度学习与大数据技术的发展,一种基于深度学习的回复生成方法被提出。该方法建立的聊天机器人可以与聊天者就任意感兴趣的话题进行聊天,具有良好的扩展性。然而这种基于深度学习模型的序列到序列的建模方法利用的是最大似然概率来生成回复语句的每
精神分裂症(Schizophrenia,SCZ)是一种具有严重危害性的慢性精神类疾病,可能给个人及家庭甚至社会带来沉重负担。目前,SCZ的病因和发病机制不完全清楚,临床主要依靠医生经验及患者与家属的病情陈述进行诊断与疗效评估,缺乏客观的评判指标。因此,寻找SCZ的客观电生理标志物以改善SCZ诊断及疗效评估,具有重要的临床意义。临床治疗SCZ主要以抗精神分裂症药物为主。本文针对服用氯氮平的SCZ患者
为了实现半实物射频仿真系统中近场效应误差更高效与更高精度的修正,获得三元组单元馈电的精确控制参数。本文系统的分析了已建立的修正流程和相关原理,针对现行方案存在的优化精度有限且计算效率低的问题提出对应的改进思路,从高精度智能反演算法和高效电磁正演建模两方面对修正方案进行了系统的优化设计和验证考察。对于修正方案中初始幅、相参数提取所涉及的反向优化算法,结合坡印廷矢量公式分别研究了基于PSO算法和PSO
无监督域适应(Unsupervised domain adaptation,UDA)是一种通过从有标注的源域里获得知识,并把知识迁移到缺乏标注的目标域上的机器学习方法。现主流域适应研究关注于对齐两个域的特征分布,借此希望在源域训练的分类器能适用于目标域数据。但这些方法通常存在两个缺陷:(1)分类器偏向源域数据:大部分UDA方法只考虑最小化两个域的差异和源域的分类损失,而不对分类器施加其他约束。所以
目前,人们对于情感的表达尤为重视,中老年人喜好看新闻短评,时不时会发表自己的态度和观点;年轻人喜好在微博、知乎等平台分享所见所闻。以及一些短视频社交软件的不断涌现,比如抖音、Vlog等,人们表达情感的欲望更加强烈,情绪在生活中的作用也越来越不容忽视。良好的情绪,能帮助自己更好地完成工作;消极的情绪,对身体机能有一定伤害的同时,甚至还会影响健康人格的形成。随着疫情防控常态化,人们对心理健康的关注度上
社交网络信息传播速度快、范围广、即时性强,吸引海量用户通过社交网络分享社会消息、讨论现实事件。社交网络事件通常是现实事件在网络空间的映射,因此研究社交网络热点事件预测具有重要意义与价值。例如,预测热点事件能够辅助相关部门管控谣言传播,避免社会恐慌,维护公共安全。用户在社交网络发布的信息以文本内容为主,文本与事件热度相关性高,并且相较其它事件相关数据更易获取,是事件预测的重要数据基础。然而文本数据价
机器学习是人工智能研究中的关键技术,在医学健康方面有着广泛的应用前景。心血管疾病(Cardiovascular Diseases,CVD)是目前世界上对人类社会造成严重健康威胁的疾病。采用机器学习方法对CVD风险进行精确地预测,可以有效识别高风险患者及危险因素,及时采取相应的干预措施并帮助医疗机构优化资源分配,具有重要的现实意义。针对CVD风险预测,本文进行了以下几个方面的研究工作:(1)研究了基