论文部分内容阅读
中国书法是中国传统文化的一块瑰宝,以其优雅的艺术美感吸引了众多的书法爱好者。一直以来,数字书法知识服务系统作为大学数字图书馆国际合作计划(China Academic Digital Associative Library,CADAL)的特色子系统面向广大的书法爱好者提供服务。但是传统的基于元数据的浏览和检索越来越不能满足用户的文化审美需求,如何基于数字书法提供更好的服务成为一个重要的挑战。 本论文从数字书法知识应用服务需求出发,针对数字书法进行了书法字形状特征表达、快速书法字检索、书法字识别以及书法字风格识别等方面的研究,主要工作如下: 1.书法字图像特征表达。提出了一种带方向的基于书法字轮廓的形状上下文描述子(Oriented Shape Context,OSC),该描述子在传统的形状上下文描述子的基础上包含了书法字轮廓点位置的梯度方向信息,提高了书法字匹配的精度,并缩短了匹配的时间。 2.快速书法字图像检索。提出了结合哈希索引近似匹配和精确匹配的两阶段快速书法字图像检索方法。数据准备阶段,使用哈希算法针对书法字图像的GIST描述子进行数据索引。对于用户提交的书法字图像,第一阶段使用哈希算法基于GIST描述子快速生成近似近邻集合;第二阶段,使用书法字图像OSC描述子在缩小后的近似近邻集合上进行精确匹配,最后将检索结果按照OSC距离排序返回,既保证了书法字检索速度又保证了检索质量。 3.书法字识别。提出了一种基于SH-MQDF(Spectral Hashing-Modified Quadrat-ic Discriminant Function)的书法字识别方法。该方法使用GIST描述子描述书法字图像,使用谱哈希算法进行相似书法字快速选择,进而在此基础上训练MQDF分类器进行书法字识别,相比基于检索的书法字识别方法,提高了书法字识别的效率。 4.书法字风格识别。提出了一种基于混合CNN-MQDF(Hybrid Convolutional Neural Network and Modified Quadratic Discriminant Function)的书法字风格识别方法。该方法通过对深度卷积神经网络进行参数转移学习,将在大数据量下训练好的网络参数转移到混合CNN-MQDF网络中,克服了书法字库数据量相对较小,训练数据不足的缺点,同时进一步训练MQDF分类器进行风格识别,提高了书法字风格识别的准确率。 5.数字书法知识服务系统实现。设计并实现了CADAL数字图书馆的数字书法知识服务系统。提供了基于元数据的书法字、书法作品以及书法书籍的检索和浏览的基础服务,同时基于本文算法提供了基于形状相似的快速书法字检索服务;实现了书法字识别算法以及书法字风格识别算法,并在此基础上提供了半自动的书法标注服务。