基于深度学习的古文字识别研究

来源 :西南大学 | 被引量 : 0次 | 上传用户:wang3993
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
古文字作为人类用符号来记录古代历史、经济、文化、科学技术发展的瑰宝,其对文明历史的传承和知识文化的传播发挥着不可替代的作用。然而古文字一直是冷门领域,相关的研究资料也是非常贫瘠。究其原因主要是其自身的特殊性,比如需要掌握丰富的专业知识和多年的研究经验的学者,同时由于历史发展和保护条件有限,大量古文字载体存在不同程度的损毁。因此古文字的保护研究工作迫在眉睫。古文字识别是古文字学最为核心的研究课题,本文主要借助深度学习方法研究了古文字识别中的三个难点问题。一是古文字中存在众多的异体字,异体字往往由于字形差别较大而难以识别为同类字符,这是古文字识别精度难以提升的关键。二是古文字的种类繁多,往往大多数古文字数据集都是数据不足和数据分布不平衡,而传统的深度学习方法依赖大量数据。三是古文字中经常会发掘出新的古文字,而且未考释的新文字占据古文字较大比例,目前的深度学习模型往往没有办法辨别出新文字并且在不经过重新微调训练的情况下对新文字识别,这也称为开放集识别。为了很好的解决上述难点问题,本文给出了具体的研究方案和初步探索并且获得了较好的实验效果。具体来说,本文的主要贡献如下:1.针对古文字中的异体字问题,本文提出了多尺度特征融合的异体字识别网络(HCMFFNet)。本文的HCMFFNet主要包括了多尺度特征融合模块(MSFFM)和特征嵌入融合模块(FEFM)。MSFFM主要三部分组成,底层卷积特征枝干部分用于提取丰富的低级图像特征;受残差学习和多尺度网络启发,我们分别设计了提取包含多种不同尺度和不同形状的尺度局部特征的多尺度残差学习块和多尺度融合降采样块。为了改进传统的嵌入编码结构,我们设计了四种FEFM来获取更加鲁棒性的嵌入特征。异体字的关键特征(包含了多尺度特征和多形状局部特征)泛化为通用特征是HCMFFNet的亮点所在,通过实验证明,HCMFFNet提高了各个古文字数据集的识别精度,在一定程度上解决了异体字识别困难的问题。2.针对古文字中的小样本问题,本文提出了基于深度度量学习的孪生相似网络(SSN)。本文采用了双阶段的学习识别策略,第一阶段通过大量的验证任务来训练本文的SSN,第二阶段就是将训练完全的SSN用于基于最近邻的单样本分类。SSN首先接收两张同类别或不同类别的古文字图片输入,然后通过前面提出的HCMFFNet网络提取多尺度融合嵌入特征。受欧式距离和余弦距离自身的局限性,本文提出了加权联合距离(WJD),将计算嵌入特征的加权联合距离,最后通过单节点映射为相似度评分值。为了解决传统对比损失函数的缺陷,本文设计了软相似度对比损失(SSCL)用于优化本文网络。孪生网络结构是构建大量训练样本的关键所在,另外验证任务将复杂的多类别问题转换为简单的二分类问题。通过实验对比发现,我们提出的SSN获得了最佳的单样本识别性能。3.针对古文字中的新文字发现和识别问题,本文提出了相似度原型网络(SPN)。我们改进了提出的SSN并且将其应用于解决古文字的开放集识别问题。考虑到距离和相似度之间的关系,我们设计了一个简单的距离-相似度非线性映射模块(DSM)用于获取两张古文字更为准确的相似度评分值。然后设计了用于单样本分类的累计类原型(CCP)来解决均值类原型和随机类原型存在的问题。最后,我们提出了拒识阈值采取指标用于区分新文字,对相似度值较低的古文字进行拒识而归类为新文字。另外,单样本分类是基于最高相似度评分进行分类识别,因此我们的模型对于新文字可以不经过训练微调网络结构直接通过计算相似度评分值来获得分类结果。通过实验发现,SPN有着较高的拒识新文字的准确率,并且将拒识的新文字加入到单样本分类中仍然可以获得较高的开放集识别精度。
其他文献
随着互联网技术的快速发展,社交网络作为重要的信息载体,极大程度改变了信息的传播方式,使每个人都能扮演信息的创造者、传播者和消费者,因此,对信息流行度的高效预测成为了研究热点之一。然而,由于内容形式的多样性、网络结构的复杂性以及影响因素的多元性使得预测任务面临众多挑战,如何建立高效的预测模型是亟待解决的问题。通过对相关文献资料的充分调研,本文深入研究并分析了信息流行度的诸多影响因素,运用深度学习技术
学位
瑞幸咖啡在2017年以来发展的三年时间里,一直在吞噬着星巴克和蓝山咖啡等主导的咖啡饮品市场。通过对瑞幸咖啡的分析可以看出,瑞幸咖啡的价值链管理还存在着一些问题,这将会影响到其未来市场核心竞争力的发展。因此,文章利用环境分析和SWOT分析等手段,对瑞幸咖啡的核心竞争力进行了深入的分析,提出相应的策略。希望通过文章的研究,能够对目前市场环境下瑞幸咖啡的核心价值进行进一步的优化,并且为其他新兴行业的企业
期刊
随着社会经济持续发展和城市建设不断加快,城市公共交通在提高交通服务运营水平、改善城市居民出行体验上愈发重要。然而在城市公共交通日常运营中,部分地铁站点或公交站点在遭受极端天气后可能引发大范围交通阻塞,导致交通系统结构连通性严重下降。同时,城市公共交通系统存在不平衡发展现象,部分地铁站点或公交站点承载了城市公共交通系统的大部分运量。为提升城市公共交通网络抗毁程度,避免站点故障大幅降低出行效率,优化交
学位
随着大数据智能领域的迅速发展,人类向着信息化社会不断前进和突破,现在已经进入到了现实世界和虚拟世界相结合的时代。如何综合分析不同领域带来的不同体量和维度的信息来提供正确的决策是当前领域发展必须面临的问题。在多类型信息源融合的实际应用过程中,一般都是通过传感器来获得相应的信息,传感器的信息收集是多传感器融合过程中至关重要的第一步,信息源的可靠性收集决定着最终的决策结果是否正确。现实情况中,由于恶劣天
学位
基于2022年“高校考试招生改革引导学生德智体美劳全面发展研究”项目组所收集的“高考改革调查问卷”中40326份高中生问卷,结果显示:高中生对高考选科制度和选科结果基本满意,对高考选科需要多主体共同参与基本认可,认为高考选科利于专业选择与职业规划,部分高中生选科时出现心理焦虑,传统文理分科仍是所选人数最多的组合。同时也发现:高中生对高考选科制度和对未来发展的引导基本满意、对家长参与高考选科的认可度
期刊
癌症主要由体细胞基因突变加速积累导致细胞无限增殖引起,癌症研究的一个关键步骤是识别导致肿瘤从正常状态向恶性状态转变的驱动突变和驱动基因。此外,癌症驱动基因往往只在少数生物学通路中发生作用。因此,研究者们开始将关注点从识别驱动基因转移到识别驱动通路。识别驱动通路有助于揭示疾病发生和发展的自然规律,对癌症患者的精确治疗、新的药物靶点和诊断测试具有重要意义。研究表明,多条通路在相同的生命活动和致癌过程中
学位
随着科技的发展和信息化设备的普及,现实世界中实体间联系的多维度属性愈发明显,如社交网络中存在不同的社交平台,分别表示用户不同的社交偏好,具有不同的社交属性,准确表征用户在不同社交平台下多维度的社交行为,对于社交网络的分析研究具有重要意义。由于多层网络独特的分层结构,使其能准确刻画实体间的多维度联系,因而已经逐渐成为建模、分析和研究多关系复杂系统的重要工具。在网络科学中,识别多层网络潜在的社团信息对
学位
随着时代的发展,人们对社会公共安全的需要也不断提高,越来越多的学者投入到相关领域的研究中。行人重识别作为一项人工智能技术,被广泛的运用到城市的安防系统中,其主要研究内容是在跨设备下的监控图像或者视频序列中检索出目标行人。现有的行人重识别方法大多集中在对一个模态的研究,即可见光模态,所用的行人图像均取自于工作在白天的可见光摄像头。事实上,这样的摄像头并不能在弱光或者黑暗的条件下捕捉到有效的行人信息。
学位
随着语义网的不断发展,RDF(Resource Description Framework,RDF)数据已被广泛用于各个领域的知识建模与数据重用,导致其数据量呈现出爆炸式的增长。RDF数据所形成的RDF图知识库(简称为RDF图)也从刚开始的仅数百万条数据增长至上亿条数据,其中开放关联数据(Linked Open Data,LOD)截止到目前已拥有超过620亿条链接数据。各领域RDF数据的不断增长,
学位
使用频率高、运动损伤(如摔跤)、疾病(如脑中风)等都可能导致腕关节功能性障碍。腕关节康复训练在促进功能障碍恢复中起着重要作用。AR(Augmented Reality,增强现实)技术是一种借助相关技术把虚拟对象无缝叠加到真实世界中,从而实现对真实世界环境增强补充的技术。将AR技术和腕关节康复相结合,把计算机生成的虚拟指导训练信息叠加到病患腕关节真实训练过程中,让病人清晰、明确地看到自己当前肢体动作
学位