【摘 要】
:
中国非物质文化遗产水书文化面临失传威胁,近年大量深度学习的方法用于手写古籍文字的识别.但水书古籍文字识别面临数据集建立和标注困难、样本不平衡等问题,研究进展不大,且鲜少进行水书古籍页面级的文字检测与识别.首先建立了一个较大规模的水书手写文字数据集,通过几种数据扩增方式,获得包含80个文字类别,共110610个带标签的字符样本.将Faster-RCNN(faster-region based convolutional neural network)算法应用到水书古籍文字识别研究上,以不同组合的数据集作为输
【机 构】
:
厦门大学信息学院,福建 厦门 361005;凯里学院大数据工程学院,贵州 凯里 556011;厦门大学闽台非遗文化数字化保护与智能处理文化和旅游部重点实验室,福建 厦门 361005;厦门大学信息学院
论文部分内容阅读
中国非物质文化遗产水书文化面临失传威胁,近年大量深度学习的方法用于手写古籍文字的识别.但水书古籍文字识别面临数据集建立和标注困难、样本不平衡等问题,研究进展不大,且鲜少进行水书古籍页面级的文字检测与识别.首先建立了一个较大规模的水书手写文字数据集,通过几种数据扩增方式,获得包含80个文字类别,共110610个带标签的字符样本.将Faster-RCNN(faster-region based convolutional neural network)算法应用到水书古籍文字识别研究上,以不同组合的数据集作为输入进行实验,在全部80个目标类别上获得了91.95% 的平均识别率,实现了页面级的端到端的水书古籍文字的准确定位与识别.实验结果表明,Faster-RCNN模型在目前的数据集上能很好地实现水书手写文字的检测与识别,文中采用的数据扩增方式能明显提升水书手写文字的识别率,为水书文化的保护和传承提供了新思路,对于解决实际应用场景中的水书文字识别问题具有重要意义.
其他文献
航空发动机叶片三维面形数据重建是评价发动机叶片加工精度的重要手段.提出一种基于增强特征信息的双目视觉三维重建方法:首先在发动机叶片表面张贴圆形标记以增强叶片表面特征信息;其次通过相机的多角度拍摄获得能够覆盖叶片全貌的图片,并利用圆心特征匹配算法实现左、右图片中对应的圆形标记点的匹配;最后利用双目视觉三维重建原理计算得到三维点云数据,从而重构发动机叶片面形.对重构后的发动机叶片三维数据与白光扫描设备(精度0.05 mm)所得的扫描数据进行对比可得,发动机单叶片的叶背、叶盆的偏差平均值分别为0.1032和-0
RV减速器是机器人的核心部件,其传动精度对机器人性能起着重要作用.为提高其传动精度,建立了RV减速器的传动误差的等效模型,并利用刚度经验公式对模型的参数进行求解,得到减速器的理论传动误差.在动力学模型的基础上,采用改进遗传算法对模型中的经验公式参数进行了优化.将优化得到的误差模型与通过经验公式计算出的误差模型进行对比,结果显示优化后的误差比计算误差降低了10.09%,有效地提高了RV减速器的设计精度.
根据超大口径光学元件的加工需求,设计一种适应1~2m口径光学元件抛光的气囊工具头.建立了气囊工具头受载的有限元仿真模型,并以常用的球冠半径为80 m m的气囊工具头的静态加载实验验证了仿真模型的可靠性.基于平均压强一致性原则和仿真模型设计了球冠半径为320 m m的大尺寸气囊工具头,优化设计得到球冠内外橡胶层厚度分别为3和6mm,中间金属层厚度为1.2mm的气囊工具头结构.仿真得到其适应的下压量范围为2.4~3.2mm,在2.5 mm的下压量时得到2025 N的抛光正向力,接触压强呈类高斯型,最大值达0.
悬浮泥沙质量浓度(SSC)是我国河口水体研究的重要水质参数之一,遥感测定SSC是一种重要的方法.为了研究遥感光谱数据和表层悬浮泥沙质量浓度(SSSC)之间的定量梯度关系,本文采集了长江口南汇嘴附近的表层沉积物,定量设计了SSSC的梯度变化值,利用ASD高光谱仪对不同质量浓度含沙水体进行了光学特性测量.结果表明,随着SSSC的增加,水体的光谱反射率曲线具有相似的形态,但也存在一定的差异.当SSSC52.69 mg/L时,光谱曲线第一反射峰位于570~710 nm,并在近红外波段780~820 nm处出现第二
由于背景环境复杂,检测物体易受部分遮挡、天气以及光线变化等因素的影响,传统目标检测方法存在提取特征难、检测准确率低、检测耗时长等缺陷.为了改善传统目标检测方法存在的缺陷,实现快速准确的目标检测,提出了一种基于快速区域卷积神经网络(faster regions with convolutional neural network,Faster-RCNN)算法的轻量化改进方法,即针对算法Inception-V2特征提取网络进行轻量化改进,并以带泄露线性整流(leaky rectified linear unit
2010年6月28日至8月初,广西凌云与凤山交界地区出现一次罕见的震群活动.利用震区附近8个近距离台站所记录的数字地震波形,按照高信噪比和计算要求,挑选出此次震群中74次ML>1.5地震可用于计算地震尾波的共179条三分向波形记录,采用Sato单次散射模型经滤波以及消除环境噪声后,计算了地震尾波传播过程途经区的品质因子 Q(f)值;拟合Q(f)值与频率f之间的关系,得到研究区Q(f)=(44.32±23.56)f0.88±017;并对震中区及其邻区地震尾波衰减的时间与空间特征进行了探讨.通过分析震区及其附
电液伺服系统动态性能复杂多变,很难为其运动控制获得精确的动力学模型.本文以高精度电液伺服仿真模型作为研究对象,将电液伺服系统位置控制问题转化为强化学习中的状态稀疏奖励问题,使用基于强化学习的屏障函数安全控制方法进行控制器整定.相比传统控制方法,本文直接通过优化状态空间稀疏奖励与安全屏障辅助奖励实现基于数据的安全强化学习控制器整定,其预设安全性为强化学习控制方法实际应用于工业生产奠定了基础.结果表明,使用安全屏障辅助奖励项进行稀疏奖励优化保障算法收敛性的同时能有效实现稳态安全控制目标.在高精度电液伺服系统非
为了从甲骨拓片图像中自动提取甲骨字符信息,本文基于深度神经网络构建了一个甲骨字符提取的双分支融合网络(dual-branch fusion network for extracting Oracle characters,EOCNet).EOCNet包含3个基本特点:首先,为了能够利用生成网络较强的结构信息描述能力,EOCNet以对抗生成网络(generative adversarial network,GAN)为基本骨架,将甲骨字符提取问题视为图像到图像的转换任务;其次,为了能利用语义分割网络较强的拓片
以中国知网(CNKI)和Web of Science核心合集数据库为数据源,采用文献计量学方法,借助CiteSpace可视化分析软件,对国内外研究涌潮的国家、机构、作者、载文期刊及关键词等进行分析.在CNKI共检索出433个研究机构的632名作者在239种刊物上发表的652篇文献(1964—2020年),“钱塘江河口”和“长江口北支”是国内关注度较高的区域;“涌潮形态”、“河床演变”、“涌潮压力”和“涌潮高度”等为研究的热点关键词;“涌潮数学模型”和“模型试验”等为涌潮研究的重要手段.在Web of Sc
实时、准确的短期交通流预测是智能交通系统的基础和关键技术之一.由于灰狼优化算法(GWO)存在收敛速度慢、易陷入局部最优解等缺陷,为进一步提升短期交通流预测的精度,提出了基于改进灰狼算法(IGWO)优化支持向量机(SVM)的短期交通流预测模型.首先,本文提出引入帐篷(Tent)混沌序列初始化灰狼种群,更改收敛因子的线性递减公式,对灰狼群体进化差分丰富种群多样性等方法提高算法的收敛速度和收敛精度.之后,通过对8个测试函数的计算,并与粒子群算法(PSO)、GWO进行对比,证明IGWO的先进性.最后,建立IGWO