基于语义分割和指针网络的书法笔画提取

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:kuanhezyong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
笔画是汉字的基本组成单位。笔画的结构布局、笔迹风格也是汉字“神”与“形”之美的来源。笔画提取可以分为笔画分解和笔画排序两个子任务,即先从文字图像中分解出构成该文字的独立笔画图像,再按照标准笔画顺序排序。书法笔画提取可应用于书法作品的动态重现、书法评价等问题,对书法文化的传承有重要意义。而现有的笔画提取方法通常存在对复杂笔画识别效果差、算法效率低、无法处理未知文字、忽视笔画顺序等问题。现有的笔画提取数据集中,也缺乏较大规模的书法字体数据。针对现有笔画提取数据不足的问题,本文提出了一种只需少量人工标注的笔画提取数据集构建方法。该方法首先标注少量笔画类别数据,训练笔画分类器对剩余笔画分类,从而得到单一字体笔画提取数据集。然后通过数字墨水仿真模型,将其迁移至其他字体风格。本文结合该方法和现有数据集构建了楷书、硬笔楷书和隶书书法笔画提取数据集。针对现有数据驱动笔画分解模型无法处理未知文字的问题,本文提出了基于语义分割的书法笔画分解模型Data Augmented Stroke(DAS)。该模型由数据增强模块、Deep Lab V3+和推理模块组成,并使用加权交叉熵进行训练。DAS模型在本文提出的三个书法笔画提取数据集上,前景的频率加权交并比(FFWIo U)都达到了93%以上。而在公开数据集上,DAS模型也取得了有竞争力的结果,并且有可以处理未知文字的优势,具有更好的通用性。针对笔画排序任务,本文基于指针网络提出了全新的指针笔画排序模型PSOM及其优化模型PSOM-slim。该模型使用Res Net对笔画图像编码,使用注意力层和LSTM进行解码得到排序结果。PSOM-slim在三种字体的数据上排序准确率都达到了97%以上。与现有的数据驱动笔画排序方法相比,PSOM具有预测时不依赖笔画库和可以处理未知文字的优势。最后,本文将DAS与PSOM-slim结合,得到完整的书法笔画提取模型,并在多种字体的书法名帖上进行了测试。实验表明,该模型能够较好地解决楷书、硬笔楷书和隶书的书法笔画提取问题。对于笔画提取非常困难的行书数据,模型也可以给出部分合理的结果。
其他文献
中长期的天气预报主要是指两小时以上的天气预报,其在灾害预警、降水估计、农业灌溉和交通规划等领域都有着重要的应用价值。而中长期的天气预报主要依赖于卫星云图预测任务,它是时空序列预测的一种应用场景。但由于卫星云图序列运动规律计算困难且预测时间长,该预测任务具有极大的困难与挑战。传统的光流法和交叉相关法都是建立在理想的条件下,对卫星云图的复杂运动系统难以预测。而近年来基于深度学习的时空序列预测算法在处理
学位
近年来,微软小冰、天猫精灵等聊天机器人的研究与运用得到快速发展,并开始扮演着重要的角色。除了进行正常的自然语言理解与生成外,拥有情感理解与同理心对话能力是聊天机器人的重要特征。合理有效的同理心回复可以带来更好的用户体验。现有的同理心对话方法主要采用多任务学习框架,在情感分类的同时进行回复生成,取得了不错的效果,但仍存在一些问题。一方面现有方法通常只利用了部分情感信息,却忽视了其他与对话相关的状态信
学位
近两年,随着新冠肺炎防疫逐渐常态化、医疗资源短缺与地区不平衡现象愈发突出,线上问诊研究逐渐成为热点。医院内医患问诊对话文本蕴含大量诊断指导信息,如何挖掘问诊对话数据中的逻辑,并以此实现对话自动诊断是一个具有科学研究价值和实际应用场景的研究方向。当前对话策略研究将患者的症状、检查信息标准化,和疾病信息共同构成医生的动作集合,将整个对话过程建模为序列决策过程,使用强化学习来模拟医生诊断过程。这种建模方
学位
目的本研究旨在评价围产期双酚AF(bisphenol AF,BPAF)暴露(0、0.34、3.4和34 mg/kg/bw/day,对应于对照组、低、中、高剂量组)可能会导致的成年小鼠后代认知功能的影响,同时通过氧化应激和突触可塑性蛋白表达水平的变化探究其是否与成年子代认知功能的影响相关,探讨其简要机制。还探讨了海马雌激素受体(estrogen receptors,ERs)的改变,以解释低、中剂量B
学位
目的本研究基于合肥市母婴健康出生队列(MIH-Hefei),分析妊娠期糖尿病(Gestational diabetes mellitus,GDM)的诊断时间与胎儿宫内生长、新生儿出生形态和婴儿体质指数(BMI,Body mass index)生长轨迹变化的关系,并进一步探讨孕母的孕前期体重过度增加和炎症水平在上述关联中的作用。方法2015年3月至2020年12月,在合肥市三家医院共招募定期产检的孕
学位
随着社交网络平台的普及,网络用户得以在社交平台上浏览感兴趣的问题,并附上与自己的看法或立场相关的主观性评论。对这些评论数据进行分析,可以了解和引导社交平台上人们舆论发展的趋势,具有重要的研究价值和产业应用前景。问答立场检测目的是识别用户回答对问题中观点所持有的立场倾向,即支持、中立和反对。现有的问答立场检测方法主要包括基于机器学习的方法和基于深度学习的方法。基于机器学习的方法重点在于人工特征构造上
学位
目的 了解糖尿病儿童青少年血糖控制的现状及其影响因素,探讨自我管理行为在抑郁症状与血糖控制关联中的中介作用,为糖尿病儿童青少年疾病的管理与治疗提供科学理论依据。方法本研究采用便利抽样的方式对前来安徽医科大学第一附属医院、安徽医科大学第二附属医院、安徽省儿童医院和安庆市立医院四家三级甲等医院就诊的糖尿病儿童青少年进行问卷调查,共207例患者最终纳入分析。问卷内容包括一般人口学特征、糖尿病相关信息、抑
学位
目的描述安徽省育龄夫妇40种抗生素及两种代谢物的分布特征和共暴露模式,评估夫妇低剂量持续暴露于抗生素的累积健康风险评估,探索夫妇暴露水平的相关性及其影响因素。方法本研究纳入来自育龄夫妇生殖健康-安徽队列的1 500对育龄夫妇作为研究对象,于2019年08月—2020年08月采用自编的基线问卷收集纳入夫妇的人口统计学信息、生活方式和饮食习惯等信息。同时采集他们的尿样并分装冻存在-80℃冰箱。从已完成
学位
近年来,互联网正在快速发展,它所承载的信息量也在指数级增长。传统的人工筛选信息的方法已经很难满足实际需求。因此,如何对这些信息进行快速地自动化处理就显得尤为重要。对于纯文本信息,已有诸多成熟的方案可以提取出其中的关键部分。对于嵌入图像的文本信息,传统的方法是利用文本识别技术将文字提取出来,然后再对内容进行分析。但随着智能手机的普及,大量嵌入图像的文本信息通过手机拍摄的方式记录,这样的图像不具备扫描
学位
目的孕期暴露可通过表观遗传途径传递给后代并引发神经精神疾病,但目前表观遗传在氰戊菊酯暴露引起神经行为损伤中的作用还鲜有探究。本研究通过建立孕期氰戊菊酯暴露以及NAC干预的动物模型,研究孕期氰戊菊酯暴露及NAC干预后对子代成年小鼠焦虑样行为的影响。方法构建孕期氰戊菊酯暴露及补充N-乙酰半胱氨酸的动物模型。购买7周龄ICR小鼠,30只雄鼠60只雌鼠。适应性喂养一周后,按照雌雄2:1的比例合笼,持续五天
学位