论文部分内容阅读
加强对外观设计专利的保护是完善知识产权保护制度的重要环节,检索是保护外观设计专利的关键手段。外观设计专利检索系统主要是一个基于内容的图像检索系统。由于基于内容的图像检索系统存在语义鸿沟的问题,且外观设计专利申请文件相关的文本数据中有关外观设计专利图像内容的描述信息十分有限,因此外观设计专利图像检索系统存在检索效率低以及无法满足用户多样性语义检索需求的问题。图像分类是跨越语义鸿沟的重要方法之一,可以提高系统的检索效率,还能够满足用户语义检索的需求。但是外观设计专利图像数据量通常来说十分庞大,而一般的图像分类模型往往只能实现图像类别的自动识别与判定,难以表达出图像中更多的内容信息,因此对于系统检索效率的提升非常有限。图像描述(Image Caption)能够自动生成给定图像的内容描述,可以表达出图像中更丰富的内容信息,所以研究图像描述十分必要。本文针对于上述问题,将图像描述应用到外观设计专利图像,提出一种基于图像描述的外观设计专利图像分类方法。为了验证文本提出的方法的可行性,主要的工作内容如下:通过分析外观设计专利分类依据以及提高外观设计专利图像检索效率使用的检索特征,对原始的外观设计专利图像进行标注,构建外观设计专利图像描述数据集。在获取外观设计专利图像描述模型编码网络的过程中,本文将两个在Image Net数据集上预训练的卷积神经网络(VGG16和inception V3)来实现外观设计专利图像分类模型。通过训练和微调,获得了两个基于预训练卷积神经网络的外观设计专利图像分类模型,且在外观设计专利图像分类上的准确率高于实验对比模型。同时,本文分析了编码网络的图像特征提取的性能。通过在外观设计专利图像描述数据集上训练基于编码器-解码器结构的外观设计专利图像描述模型,实现了模型对外观设计专利图像的自动描述生成。通过分析模型生成的描述结果在外观设计专利图像分类特征上的识别准确率,验证了本文提出的方法的可行性。同时,在其他条件相同的情况下,文本分析了不同的编码网络对于外观设计专利图像描述模型性能的影响,以及不同的训练样本量对模型在外观设计专利图像分类性能上的影响。