基于深度学习的商周金文文字识别研究

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:tyb798229
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
金文,是中国古代商周时期用于记录的主要书体。研究商周金文,对了解古代历史、考察古代社会生活等均具有重大意义。识别商周金文文字是基础性的工作,但目前其仍需由经验丰富的古文字专家费时费力地完成。随着现代计算机图像识别技术的成熟,特别是深度学习技术的发展,计算机实现文字识别的方法取得了巨大的进步,现今已可获得良好的识别结果。基于以上背景与需求,本文旨在使用深度学习相关技术,对商周金文文字识别任务进行研究。本文的主要工作有:(1)归纳整理出一个格式统一完整的商周金文数据集,并对该数据集进行数据增强。使用平移、旋转等仿射变换方法和弹性变换方法扩充该数据集;使用3D建模软件Rhino进行二次开发,为数据集引入模拟的光照效果;使用隐式语义数据增强(ISDA)方法进一步实现数据增强,帮助模型获得更强的泛化能力。(2)研究了基于注意力机制的商周金文文字识别方法。本文探索、研究使用神经网络实现对商周金文文字的识别。使用了VGG、Res Net等神经网络结构进行实验,取得了良好的实验结果。在此基础上,为模型引入注意力机制,在网络数据输入层加入注意空间域的空间变换网络(STN),帮助整个系统达到了更好的识别效果。(3)研究使用图像生成方法改善数据集样本不均衡问题。本文使用的商周金文数据集存在类间和类内样本不均衡的问题。针对那些由此问题造成的仍无法有效识别的商周金文文字图像,本文研究使用生成对抗网络(GAN)和变分自编码(VAE)图像生成技术,帮助生成与无法识别图像相似的图片加入训练,以帮助获得识别效果更好的模型。在此商周金文数据集上,大量细节性的实验被实践完成。最终模型获得了91.387%的准确率,证明了本文提出方法的可行性和有效性。
其他文献
近年来,在基因编辑领域,CRISPR/Cas9技术由于其高效、鲁棒与可编程的特点,目前正受到生物医学界的广泛关注。Cas9核酸酶可以在gRNA的作用下,于靶点位置诱发DNA双链断裂,从而可以编辑基因组中特定位置的基因片段。由于脱靶效应导致的碱基意外插入和删除是CRISPR/Cas9系统在实际应用中存在的一个问题。为了解决这一问题,具有更高特异性的CRISPR/Cas9变体被设计出来。大量Cas9变
学位
无线Wi-Fi的信道状态信息(CSI)是一种极细粒度的感知源,能够提供丰富的环境变化特征,在实现更为精确的行为感知的同时还具有优秀的非侵扰性。因此基于CSI的人体动作识别在家庭健康、普适情景感知以及人机交互等领域具有非常重要的作用。然而目前的识别方法会在分析的过程中加入大量冗余的静态信息,同时往往会忽略时间上下文之间的联系,这对于依赖长时间序列的动作的识别具有一定的局限性,并且这些方法在应对场景的
学位
在线社交网络已成为当前主流的信息传播媒介,研究在线社交网络上的消息传播对于理解其上传播规律及实现有效地管控具有重要意义。一方面,揭示消息传播的机制和影响因素有助于人们及时、高效地获取有用信息。另一方面理解谣言、流言和虚假消息的传播机制有助于快速地进行舆情控制。以往的研究尚且存在不足:1)对消息传播的研究集中于日常消息传播,鲜少有针对突发事件消息传播机制的研究。2)大多数网络模因的研究仅关注生存环境
微塑料(3及Ti O2添加剂,对不同砷形态的吸附量均较大;而白色PE地膜碎片及LDPE对不同砷形态吸附量的差异不大。PE(微)塑料的理化性质以及砷形态结构均会影响砷类物质与PE(微)塑料之间的界面行为。此外,本研究证明外界环境条件的变化会直接影响微塑料与砷类物质的相互作用,包括水环境p H、盐度、共存化合物及不同水体等因素。吸附到微塑料上的砷类物质也可以持续不断以低剂量解吸或释放到周围水环境中。因
无铅铁电钙钛矿K0.5Na0.5Nb O3(KNN)作为介电性能和压电性能出色的氧化物代表,近年来受到了广泛的关注。作为新一代无铅压电陶瓷,KNN具有高机电耦合系数和品质因数等优良性能。并且对KNN此类环境友好型材料体系的研究有助于替代市场中铅基陶瓷锆钛酸铅,符合可持续发展的基本国策。在现有研究中,压电系数媲美铅基材料的改性KNN已可以成功制备。但难以解决的问题在于KNN的多晶相变共存区域是依赖于
科学技术的日益进步与发展,人们越来越追求于高精度的测量。频率作为现代物理中精度最高的物理量,许多不同的物理量的测量都转换到了频率的测量上,这就需要寻求更加精准的频率标准。光钟能将频率标准的精度提高到E-18或更高。由于它只在一个特定的频率输出激光,如果要用光钟开展高精度的精密测量,必须将光钟的频率稳定性、相干性和精度传递到其他光学或微波波段。于是,相位噪声优异的频率合成器便是实现这个目标的最佳手段
物联网(Internet of Things,Io T)由大量电子设备组合而成,通过互联网实现万物互联和信息共享。物联网已在许多领域得到广泛应用,如工业制造、智能家居、医疗健康等等。在这物联网发展如火如荼的年代,安全却成了阻碍其发展的重要原因之一。针对物联网的安全攻击不仅可能导致工作紊乱、财产损失,更有甚者将威胁到用户的隐私和生命安全。在万物互联的背景下,网络是恶意人员或组织发起攻击的主要途径,设
等离子体(Plasma)作为物质的“第四态”,蕴藏丰富的物理,化学内涵,现已广泛用于材料科学、集成电路制造、生物医学等不同领域。等离子体激发时产生的活性物质,对细菌、细胞等均有杀灭作用,所以,等离子体杀菌是生物医学领域的一个重要的研究方向。表面介质阻挡放电(Surface Dielectric Barrier Discharge,SDBD)是一种在大气压下产生非热平衡等离子体的放电方式,因其结构简