论文部分内容阅读
随着信息化社会的大发展,各个领域信息处理的数字化程度越来越高,传统的人工处理逐渐由计算机取代。在票据处理领域,纸质形式票据已经转换为图像形式进行存储和处理。票据图像分类是票据处理过程中的重要环节,是进行后续处理的必要前提。在实际业务中,存在若干种票据类别极为相似,类别之间仅存在细微差异,此种票据图像分类为细粒度图像分类。卷积神经网络模型是实现细粒度图像分类的主流模型,在模型训练时仅使用类别标签称为弱监督。双线性卷积神经网络在基于弱监督的细粒度图像分类中表现突出。本文结合票据图像特性,提出基于改进双线性卷积神经网络的票据图像分类算法。本文首先从票据图像分类研究的背景和意义等多个方面阐述票据图像分类的重要性。通过票据图像数据分析阐明本文票据图像分类与细粒度图像分类的联系。并进行本文票据图像分类算法相关基础理论的研究,其中包括卷积神经网络基本原理、VGGNet模型原理、基于弱监督的细粒度图像分类算法、全局平均池化原理、PCA降维算法和图像处理相关算法等理论知识。本文根据票据图像特性完成整体票据图像分类算法的设计,算法内容包括票据图像信息提取和改进的双线性卷积神经网络模型。票据图像信息提取得到票据信息的位置集合,并截取图像中信息位置对应的图像块集合作为改进模型的输入。改进的双线性卷积神经网络模型完成训练,实现输入票据图像分类。本文完成票据图像信息提取方案的设计,方案步骤包括票据图像的二值化、灰度化、去噪、倾斜校正、框线检测与去除和版面分析。在每个步骤中阐明使用原因和作用效果,并进行步骤相关图像处理算法的研究和改进,同时给出本文采用算法的实现步骤。本文完成双线性卷积神经网络模型的改进工作,分别对模型的输入,结构和输出进行改进。具体包括使用票据信息图像块集合作为输入完成模型输入的改进、部分融合两个分支网络实现部分计算共享,并在分支网络之间进行特征交叉融合完成模型结构的改进、在每个分支网络之后增加全局平均池化层和PCA降维对输出特征的尺寸维度和深度维度进行降维,并在最后的池化层中增加输出特征的筛选完成模型输出的改进。通过使用本文的票据图像数据进行测试,实验结果表明:本文设计的票据图像信息提取方案能够正确完成票据版面的切分,有效提取票据信息。本文改进的双线性卷积神经网络模型较原双线性卷积神经网络模型分类精度略微提高,分类速率略有提升,模型收敛速率明显加快。